speculation

推测执行通过预测和预执行可能的工具调用来优化响应速度。

设计理念

问题

AI 思考需要时间:

AI 思考 (2s) → 工具调用 (0.5s) → AI 继续思考 (2s)
总时间: 4.5s

解决方案

在 AI 思考时预执行:

AI 思考 (2s)
  ↓ (同时)
预测并执行工具 (0.5s)

AI 调用工具 → 直接使用缓存结果 (0ms)

AI 继续 (2s)
总时间: 4s (节省 0.5s)

核心实现

预测工具调用

预执行

使用预执行结果

预测策略

基于模式

基于历史

性能影响

命中率

时间节省

典型场景的时间节省:

场景
无推测
有推测
节省

读取文件

2.5s

2.0s

20%

搜索代码

3.0s

2.3s

23%

多文件操作

5.0s

3.5s

30%

配置

启用推测执行

下一步