Save Money

🧠 智能模型路由,API 成本省半

开发运维榜 #2

智慧路由模型切换,自动判断任务复杂度,日常用 Haiku 省成本,深度思考才用 Sonnet,API 费用降低 50% 以上。

收藏
24.9k
安装
6k
版本
2.2.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

Save Money 是一套成本优化策略,通过自动检测任务复杂度来决定调用哪个 Claude 模型。核心原则:默认使用 Haiku,仅在实际需要深度思考时升级到 Sonnet。判断标准为「30 秒专注思考规则」——如果人类完成该任务需要超过 30 秒专注思考,就触发升级。

升级触发条件(Sonnet)

  • 分析评估:方案比较、权衡取舍、文档审阅
  • 规划策略:项目计划、路线图、商业模式、架构设计
  • 长文写作:报告、提案、文章、超过 3 段落的邮件
  • 代码生成:功能开发、重构、复杂调试
  • 多步推理:含「首先…然后…最后」或编号步骤的任务
  • 长内容总结:长文档、完整文章、会议记录
  • 长翻译:整段文字或完整文档(非单句)
  • 创意写作:文案、广告脚本、品牌约束下的命名

保持降级条件(Haiku)

  • 事实问答、快速查询(定义、单句翻译、单位换算)
  • 记忆提醒、闲聊问候、状态检查、1-2 句话可完成的任务

进阶省钱技巧

1. 精简输出:Haiku 场景下保持回复简洁,减少输出 token
2. 主动降级:复杂对话后的简单跟进,主动切回 Haiku

显著优点

  • 成本效益明确:声称可节省 50%+ API 费用,ROI 可量化
  • 规则清晰可操作:提供多语言真实对话示例,降低判断门槛
  • 跨平台兼容:提供 Claude/OpenAI/Google 的模型映射表
  • 技术实现简单:通过 sessions_spawn 即可完成模型切换
  • 多语言覆盖:中英日韓德五语言示例,全球化适用

潜在缺点与局限性

  • 规则依赖经验判断:「30 秒思考」标准仍具主观性,边缘案例易误判
  • 无自动检测机制:需人工/Agent 主动判断,无法实现真正的「自动」路由
  • 模型版本锁定:Claude 模型名称硬编码,需手动更新版本号
  • 未考虑延迟成本:频繁切换可能引入额外网络开销
  • 缺乏成本监控:无内置用量追踪或预算预警功能

适合人群

  • 高频使用 Claude API 的开发团队与产品公司
  • 构建 AI Agent 平台、需要精细成本控制的架构师
  • 多语言客服、内容生成等 token 消耗大的应用场景
  • 希望在不牺牲质量前提下优化 AI 支出的中小企业

常规风险

| 风险类型 | 说明 |
|---------|------|
| 误判降级 | 复杂任务被误判为简单任务,导致输出质量下降、需重复请求,反而增加成本 |
| 误判升级 | 简单任务过度使用 Sonnet,造成不必要的费用浪费 |
| 上下文断裂 | 模型切换时若未妥善处理上下文,可能导致对话连贯性受损 |
| 版本过时 | 模型名称随厂商更新而失效,需持续维护 |
| 供应商锁定 | 虽提供多平台映射,但核心逻辑仍围绕 Claude 设计,迁移成本存在 |

Save Money 内容

暂无文件树

手动下载zip · 3.5 kB
contentapplication/octet-stream
请选择文件