核心用法
Save Money 是一套成本优化策略,通过自动检测任务复杂度来决定调用哪个 Claude 模型。核心原则:默认使用 Haiku,仅在实际需要深度思考时升级到 Sonnet。判断标准为「30 秒专注思考规则」——如果人类完成该任务需要超过 30 秒专注思考,就触发升级。
升级触发条件(Sonnet)
- 分析评估:方案比较、权衡取舍、文档审阅
- 规划策略:项目计划、路线图、商业模式、架构设计
- 长文写作:报告、提案、文章、超过 3 段落的邮件
- 代码生成:功能开发、重构、复杂调试
- 多步推理:含「首先…然后…最后」或编号步骤的任务
- 长内容总结:长文档、完整文章、会议记录
- 长翻译:整段文字或完整文档(非单句)
- 创意写作:文案、广告脚本、品牌约束下的命名
保持降级条件(Haiku)
- 事实问答、快速查询(定义、单句翻译、单位换算)
- 记忆提醒、闲聊问候、状态检查、1-2 句话可完成的任务
进阶省钱技巧
1. 精简输出:Haiku 场景下保持回复简洁,减少输出 token
2. 主动降级:复杂对话后的简单跟进,主动切回 Haiku
显著优点
- 成本效益明确:声称可节省 50%+ API 费用,ROI 可量化
- 规则清晰可操作:提供多语言真实对话示例,降低判断门槛
- 跨平台兼容:提供 Claude/OpenAI/Google 的模型映射表
- 技术实现简单:通过
sessions_spawn即可完成模型切换 - 多语言覆盖:中英日韓德五语言示例,全球化适用
潜在缺点与局限性
- 规则依赖经验判断:「30 秒思考」标准仍具主观性,边缘案例易误判
- 无自动检测机制:需人工/Agent 主动判断,无法实现真正的「自动」路由
- 模型版本锁定:Claude 模型名称硬编码,需手动更新版本号
- 未考虑延迟成本:频繁切换可能引入额外网络开销
- 缺乏成本监控:无内置用量追踪或预算预警功能
适合人群
- 高频使用 Claude API 的开发团队与产品公司
- 构建 AI Agent 平台、需要精细成本控制的架构师
- 多语言客服、内容生成等 token 消耗大的应用场景
- 希望在不牺牲质量前提下优化 AI 支出的中小企业
常规风险
| 风险类型 | 说明 |
|---------|------|
| 误判降级 | 复杂任务被误判为简单任务,导致输出质量下降、需重复请求,反而增加成本 |
| 误判升级 | 简单任务过度使用 Sonnet,造成不必要的费用浪费 |
| 上下文断裂 | 模型切换时若未妥善处理上下文,可能导致对话连贯性受损 |
| 版本过时 | 模型名称随厂商更新而失效,需持续维护 |
| 供应商锁定 | 虽提供多平台映射,但核心逻辑仍围绕 Claude 设计,迁移成本存在 |