performance
性能优化
模型选择策略
Haiku 4.5(Sonnet 90% 能力,3 倍成本节省):
- 高频调用的轻量 agent
- 结对编程和代码生成
- 多 agent 系统中的工作 agent
Sonnet 4.6(最佳编码模型):
- 主要开发工作
- 编排多 agent 工作流
- 复杂编码任务
Opus 4.5(最深推理):
- 复杂架构决策
- 最大推理需求
- 研究和分析任务
上下文窗口管理
避免在上下文窗口最后 20% 进行:
- 大规模重构
- 跨多文件的功能实现
- 复杂交互调试
低上下文敏感度任务:
- 单文件编辑
- 独立工具创建
- 文档更新
- 简单 Bug 修复
Extended Thinking + Plan Mode
Extended thinking 默认启用,预留最多 31,999 tokens 用于内部推理。
通过以下方式控制 extended thinking:
- 切换:Option+T (macOS) / Alt+T (Windows/Linux)
- 配置:在
~/.claude/settings.json设置alwaysThinkingEnabled - 预算上限:
export MAX_THINKING_TOKENS=10000 - 详细模式:Ctrl+O 查看 thinking 输出
对于需要深度推理的复杂任务:
- 确保 extended thinking 已启用(默认开启)
- 启用 Plan Mode 采用结构化方法
- 使用多轮批判进行彻底分析
- 使用分角色子 agent 获取多元视角
构建故障排查
构建失败时:
- 使用 build-error-resolver agent
- 分析错误消息
- 逐步修复
- 每次修复后验证