speculation
设计理念
问题
AI 思考 (2s) → 工具调用 (0.5s) → AI 继续思考 (2s)
总时间: 4.5s解决方案
AI 思考 (2s)
↓ (同时)
预测并执行工具 (0.5s)
↓
AI 调用工具 → 直接使用缓存结果 (0ms)
↓
AI 继续 (2s)
总时间: 4s (节省 0.5s)核心实现
预测工具调用
预执行
使用预执行结果
预测策略
基于模式
基于历史
性能影响
命中率
时间节省
场景
无推测
有推测
节省