核心用法
Save Money 是一套模型路由策略,核心逻辑是「默认使用便宜模型,仅在需要时升级到强模型」。通过 30 秒思考法则自动判断任务复杂度:若人类需超过 30 秒专注思考,则触发 Sonnet;否则保留 Haiku 处理。
升级触发条件包括:分析评估、规划策略、长文本写作、代码生成、多步推理、长文档摘要、完整翻译、创意写作等。系统还提供多语言实例库(英/繁中/日/韩/德),帮助识别真实对话中的升级信号,如「幫我分析這個報告」「Compare A vs B」等。
降级机制同样关键:当复杂对话后续转为简单确认(如「那就用第一個方案」),自动切回 Haiku 避免持续浪费。
显著优点
- 成本效益明确:官方宣称节省 50%+,符合模型价差(Haiku 约 $0.25/1M tokens vs Sonnet 约 $3/1M tokens)
- 规则清晰可落地:30 秒法则 + 任务类型对照表 + 多语言实例,降低判断门槛
- 支持跨平台迁移:提供 Claude/OpenAI/Google 的模型对照表
- 开源透明:GitHub 可查,策略可被审计和调整
潜在缺点与局限性
- 复杂度判断依赖启发式规则,边界模糊任务可能误判(如中等长度邮件)
- 无自动检测实现:需开发者手动集成
sessions_spawn调用,非即插即用 - 多语言示例覆盖有限:东南亚、中东等市场语言缺失
- 未涉及隐私合规:长文本升级可能涉及敏感数据跨境传输至 Anthropic
适合人群
- 高频调用 Claude API 的开发者与团队
- 构建多 Agent 系统的架构师,需精细控制推理成本
- 对响应延迟不敏感、优先控制预算的场景
常规风险
| 风险类型 | 说明 |
|---------|------|
| 误判成本 | 复杂任务误留 Haiku 可能导致质量下降、需重试 |
| 集成复杂度 | 需自行实现路由层,增加代码维护负担 |
| 供应商锁定 | 深度绑定 Claude 生态,迁移需调整策略阈值 |
| 数据主权 | 升级后的数据流向 Anthropic,需符合 GDPR/本地法规 |