Save Money

🧠 智能路由双模型,API 费用砍半

自动识别任务复杂度,智能切换 Claude Haiku/Sonnet,节省 50%+ API 成本,兼顾效率与质量

收藏
18.7k
安装
6k
版本
4.2.0
CLS 安全性认证2026-05-13
点击查看完整报告 >

使用说明

核心用法

save-money 是一套智能路由机制,让 AI 助手在 Claude Haiku(便宜快速)和 Sonnet(强力全面)之间自动切换。核心逻辑是「先分类,再行动」—— 每次收到任务时,先判断是否触发升级条件,若符合则立即调用 sessions_spawn 转交 Sonnet,否则直接用 Haiku 回复。

升级触发条件(必须转 Sonnet)

  • 分析比较、策略规划、长文撰写(>3 段落)
  • 代码生成(>10 行)、多步骤推理、结构化输出(表格、大纲、图表)
  • 长文档摘要、专业翻译、创意写作、报告提案

降级条件(可切回 Haiku)

  • 事实问答、定义查询、短句翻译、提醒备忘
  • 简单寒暄、状态检查、1-2 句即可完成的任务

进阶技巧

  • 30 秒法则:若人类需要专注思考超过 30 秒,就升级
  • 回复精简:Haiku 回答保持简短,减少输出 token
  • 动态降级:复杂任务后的简单跟进,主动切回 Haiku

显著优点

1. 成本效益显著:Haiku 成本远低于 Sonnet,简单任务省 50%-90%
2. 响应速度更快:Haiku 延迟更低,日常问答体验更流畅

3. 规则清晰可预期:明确的触发清单,行为透明、易于调试

4. 多语言适配:内置英/繁中/日/韩/德五语示例,全球化友好

5. 跨平台迁移:提供 Claude/OpenAI/Google 的模型映射对照表

潜在缺点与局限性

  • 误判成本:简单任务误升 Sonnet仅浪费几美分,但复杂任务漏升会导致低质量输出
  • 边界模糊:某些任务复杂度居中,「30 秒法则」主观性强
  • 需人工校准:初期可能需要用户反馈调整阈值
  • 仅限文本:不涉及图像、音频等多模态成本优化
  • Claude 中心化:虽然提供其他供应商映射,但规则设计基于 Claude 特性

适合人群

  • 高频 API 调用者:日调用量大的开发者、企业用户
  • 成本敏感型团队:初创公司、个人开发者、研究项目
  • 多语言产品:需要同时服务华语、日语、英语等市场的应用
  • Claude 生态用户:已深度使用 Anthropic 模型的技术团队

常规风险

| 风险类型 | 说明 | 缓解建议 |
|---------|------|---------|
| 质量风险 | Haiku 处理复杂任务产出不足 | 严格遵循「怀疑就升级」原则 |
| 用户体验割裂 | 模型切换时回复风格突变 | 不主动告知用户,保持透明 |
| 规则维护成本 | 新场景需持续更新触发清单 | 定期复盘误判案例 |
| 供应商锁定 | 深度绑定 Claude 定价体系 | 保留 OpenAI/Google 备选映射 |

总结

save-money 是 AI 成本优化的实用典范,通过明确的分类规则实现「该省省、该花花」。适合已确认主要使用 Claude 且调用量可观的场景,建议初期保守设置(多升级),再根据实际反馈逐步收紧阈值。

安全解读

核心用法

Save Money 是一个行为路由 Skill,通过自动检测任务复杂度来优化 Claude 模型调用成本。系统遵循"先分类、后执行"原则:在生成任何响应前,先判断任务是否触发升级条件,若是则立即调用 sessions_spawn 切换至 Sonnet 模型,否则直接在 Haiku 上响应。

升级触发条件包括:分析评估、规划策略、长文写作(>3 段)、代码生成(>10 行)、多步推理、大型内容摘要、长文本翻译、创意写作、结构化输出等。Skill 提供多语言实例对照表(英/繁中/日/韩/德),帮助识别实际对话中的升级信号。降级机制同样重要——当 Sonnet 对话的后续跟进变简单时,自动切回 Haiku 继续处理。

显著优点

  • 成本效益显著:声称可节省 50%+ API 费用,对高频调用场景价值突出
  • 零配置开箱即用:纯 Markdown 行为技能,无需安装依赖或设置 API Key
  • 多语言场景覆盖:提供五种语言的触发词实例,降低误判率
  • 决策逻辑清晰:"30 秒专注思考"规则直观易操作,复杂信号列表详尽
  • 双向路由设计:支持升级与降级,避免 conversation 全程滞留高价模型
  • 安全纯净:无可执行代码,无外部依赖,无数据收集行为

潜在缺点与局限性

  • 依赖模型自我判断:分类准确性受限于当前模型的推理能力,存在误判可能
  • "When in doubt, escalate" 策略保守:过度升级可能抵消成本节省效果
  • Skill 描述冗长:核心指令挤在 frontmatter 中,影响可读性与维护性
  • 缺乏动态反馈机制:无法根据历史路由效果自我优化阈值
  • 厂商锁定:虽提供 OpenAI/Google 替代映射,但核心设计围绕 Claude 生态
  • T3 来源可信度:个人开发者项目,长期维护与更新稳定性存疑

适合人群

  • 高频 Claude API 用户:客服、内容平台、自动化工作流等调用量大的场景
  • 成本敏感型团队:初创公司或独立开发者希望优化 AI 预算
  • 多语言产品团队:需要同时处理繁中、日、韩等多语种客服对话
  • Claude Code 生态用户:已采用 sessions_spawn 等原生 API 的开发者

常规风险

1. 路由误判风险:复杂任务误判为简单任务可能导致输出质量下降,简单任务误判为复杂任务则浪费成本
2. 会话状态碎片化:频繁调用 sessions_spawn 可能增加对话上下文管理的复杂度

3. 延迟累积:模型切换引入额外网络往返,对实时性要求高的场景需评估

4. 版本兼容风险:Claude 模型版本迭代可能导致推荐映射关系过时

5. 缺乏许可证声明:当前未明确开源协议,商业使用需注意合规性

Save Money 内容

手动下载zip · 4.5 kB
SKILL.mdtext/markdown
请选择文件