核心用法
save-money 是一套智能路由机制,让 AI 助手在 Claude Haiku(便宜快速)和 Sonnet(强力全面)之间自动切换。核心逻辑是「先分类,再行动」—— 每次收到任务时,先判断是否触发升级条件,若符合则立即调用 sessions_spawn 转交 Sonnet,否则直接用 Haiku 回复。
升级触发条件(必须转 Sonnet)
- 分析比较、策略规划、长文撰写(>3 段落)
- 代码生成(>10 行)、多步骤推理、结构化输出(表格、大纲、图表)
- 长文档摘要、专业翻译、创意写作、报告提案
降级条件(可切回 Haiku)
- 事实问答、定义查询、短句翻译、提醒备忘
- 简单寒暄、状态检查、1-2 句即可完成的任务
进阶技巧
- 30 秒法则:若人类需要专注思考超过 30 秒,就升级
- 回复精简:Haiku 回答保持简短,减少输出 token
- 动态降级:复杂任务后的简单跟进,主动切回 Haiku
显著优点
1. 成本效益显著:Haiku 成本远低于 Sonnet,简单任务省 50%-90%
2. 响应速度更快:Haiku 延迟更低,日常问答体验更流畅
3. 规则清晰可预期:明确的触发清单,行为透明、易于调试
4. 多语言适配:内置英/繁中/日/韩/德五语示例,全球化友好
5. 跨平台迁移:提供 Claude/OpenAI/Google 的模型映射对照表
潜在缺点与局限性
- 误判成本:简单任务误升 Sonnet仅浪费几美分,但复杂任务漏升会导致低质量输出
- 边界模糊:某些任务复杂度居中,「30 秒法则」主观性强
- 需人工校准:初期可能需要用户反馈调整阈值
- 仅限文本:不涉及图像、音频等多模态成本优化
- Claude 中心化:虽然提供其他供应商映射,但规则设计基于 Claude 特性
适合人群
- 高频 API 调用者:日调用量大的开发者、企业用户
- 成本敏感型团队:初创公司、个人开发者、研究项目
- 多语言产品:需要同时服务华语、日语、英语等市场的应用
- Claude 生态用户:已深度使用 Anthropic 模型的技术团队
常规风险
| 风险类型 | 说明 | 缓解建议 |
|---------|------|---------|
| 质量风险 | Haiku 处理复杂任务产出不足 | 严格遵循「怀疑就升级」原则 |
| 用户体验割裂 | 模型切换时回复风格突变 | 不主动告知用户,保持透明 |
| 规则维护成本 | 新场景需持续更新触发清单 | 定期复盘误判案例 |
| 供应商锁定 | 深度绑定 Claude 定价体系 | 保留 OpenAI/Google 备选映射 |
总结
save-money 是 AI 成本优化的实用典范,通过明确的分类规则实现「该省省、该花花」。适合已确认主要使用 Claude 且调用量可观的场景,建议初期保守设置(多升级),再根据实际反馈逐步收紧阈值。