Save Money

🧠 智能路由双模型,API 费用砍半

自动识别任务复杂度,智能切换 Claude Haiku/Sonnet,节省 50%+ API 成本,兼顾效率与质量

收藏
18.7k
安装
6k
版本
4.2.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

save-money 是一套智能路由机制,让 AI 助手在 Claude Haiku(便宜快速)和 Sonnet(强力全面)之间自动切换。核心逻辑是「先分类,再行动」—— 每次收到任务时,先判断是否触发升级条件,若符合则立即调用 sessions_spawn 转交 Sonnet,否则直接用 Haiku 回复。

升级触发条件(必须转 Sonnet)

  • 分析比较、策略规划、长文撰写(>3 段落)
  • 代码生成(>10 行)、多步骤推理、结构化输出(表格、大纲、图表)
  • 长文档摘要、专业翻译、创意写作、报告提案

降级条件(可切回 Haiku)

  • 事实问答、定义查询、短句翻译、提醒备忘
  • 简单寒暄、状态检查、1-2 句即可完成的任务

进阶技巧

  • 30 秒法则:若人类需要专注思考超过 30 秒,就升级
  • 回复精简:Haiku 回答保持简短,减少输出 token
  • 动态降级:复杂任务后的简单跟进,主动切回 Haiku

显著优点

1. 成本效益显著:Haiku 成本远低于 Sonnet,简单任务省 50%-90%
2. 响应速度更快:Haiku 延迟更低,日常问答体验更流畅

3. 规则清晰可预期:明确的触发清单,行为透明、易于调试

4. 多语言适配:内置英/繁中/日/韩/德五语示例,全球化友好

5. 跨平台迁移:提供 Claude/OpenAI/Google 的模型映射对照表

潜在缺点与局限性

  • 误判成本:简单任务误升 Sonnet仅浪费几美分,但复杂任务漏升会导致低质量输出
  • 边界模糊:某些任务复杂度居中,「30 秒法则」主观性强
  • 需人工校准:初期可能需要用户反馈调整阈值
  • 仅限文本:不涉及图像、音频等多模态成本优化
  • Claude 中心化:虽然提供其他供应商映射,但规则设计基于 Claude 特性

适合人群

  • 高频 API 调用者:日调用量大的开发者、企业用户
  • 成本敏感型团队:初创公司、个人开发者、研究项目
  • 多语言产品:需要同时服务华语、日语、英语等市场的应用
  • Claude 生态用户:已深度使用 Anthropic 模型的技术团队

常规风险

| 风险类型 | 说明 | 缓解建议 |
|---------|------|---------|
| 质量风险 | Haiku 处理复杂任务产出不足 | 严格遵循「怀疑就升级」原则 |
| 用户体验割裂 | 模型切换时回复风格突变 | 不主动告知用户,保持透明 |
| 规则维护成本 | 新场景需持续更新触发清单 | 定期复盘误判案例 |
| 供应商锁定 | 深度绑定 Claude 定价体系 | 保留 OpenAI/Google 备选映射 |

总结

save-money 是 AI 成本优化的实用典范,通过明确的分类规则实现「该省省、该花花」。适合已确认主要使用 Claude 且调用量可观的场景,建议初期保守设置(多升级),再根据实际反馈逐步收紧阈值。

Save Money 内容

暂无文件树

手动下载zip · 4.5 kB
contentapplication/octet-stream
请选择文件