使用说明

核心用法

save-money 是一套智能路由机制，让 AI 助手在 Claude Haiku（便宜快速）和 Sonnet（强力全面）之间自动切换。核心逻辑是「先分类，再行动」—— 每次收到任务时，先判断是否触发升级条件，若符合则立即调用 sessions_spawn 转交 Sonnet，否则直接用 Haiku 回复。

升级触发条件（必须转 Sonnet）

分析比较、策略规划、长文撰写（>3 段落）
代码生成（>10 行）、多步骤推理、结构化输出（表格、大纲、图表）
长文档摘要、专业翻译、创意写作、报告提案

降级条件（可切回 Haiku）

事实问答、定义查询、短句翻译、提醒备忘
简单寒暄、状态检查、1-2 句即可完成的任务

进阶技巧

30 秒法则：若人类需要专注思考超过 30 秒，就升级
回复精简：Haiku 回答保持简短，减少输出 token
动态降级：复杂任务后的简单跟进，主动切回 Haiku

显著优点

1. 成本效益显著：Haiku 成本远低于 Sonnet，简单任务省 50%-90%
2. 响应速度更快：Haiku 延迟更低，日常问答体验更流畅
3. 规则清晰可预期：明确的触发清单，行为透明、易于调试
4. 多语言适配：内置英/繁中/日/韩/德五语示例，全球化友好
5. 跨平台迁移：提供 Claude/OpenAI/Google 的模型映射对照表

潜在缺点与局限性

误判成本：简单任务误升 Sonnet仅浪费几美分，但复杂任务漏升会导致低质量输出
边界模糊：某些任务复杂度居中，「30 秒法则」主观性强
需人工校准：初期可能需要用户反馈调整阈值
仅限文本：不涉及图像、音频等多模态成本优化
Claude 中心化：虽然提供其他供应商映射，但规则设计基于 Claude 特性

适合人群

高频 API 调用者：日调用量大的开发者、企业用户
成本敏感型团队：初创公司、个人开发者、研究项目
多语言产品：需要同时服务华语、日语、英语等市场的应用
Claude 生态用户：已深度使用 Anthropic 模型的技术团队

常规风险

| 风险类型 | 说明 | 缓解建议 |

|---------|------|---------|

| 质量风险 | Haiku 处理复杂任务产出不足 | 严格遵循「怀疑就升级」原则 |

| 用户体验割裂 | 模型切换时回复风格突变 | 不主动告知用户，保持透明 |

| 规则维护成本 | 新场景需持续更新触发清单 | 定期复盘误判案例 |

| 供应商锁定 | 深度绑定 Claude 定价体系 | 保留 OpenAI/Google 备选映射 |

总结

save-money 是 AI 成本优化的实用典范，通过明确的分类规则实现「该省省、该花花」。适合已确认主要使用 Claude 且调用量可观的场景，建议初期保守设置（多升级），再根据实际反馈逐步收紧阈值。

安全解读

核心用法

Save Money 是一个行为路由 Skill，通过自动检测任务复杂度来优化 Claude 模型调用成本。系统遵循"先分类、后执行"原则：在生成任何响应前，先判断任务是否触发升级条件，若是则立即调用 sessions_spawn 切换至 Sonnet 模型，否则直接在 Haiku 上响应。

升级触发条件包括：分析评估、规划策略、长文写作（>3 段）、代码生成（>10 行）、多步推理、大型内容摘要、长文本翻译、创意写作、结构化输出等。Skill 提供多语言实例对照表（英/繁中/日/韩/德），帮助识别实际对话中的升级信号。降级机制同样重要——当 Sonnet 对话的后续跟进变简单时，自动切回 Haiku 继续处理。

显著优点

成本效益显著：声称可节省 50%+ API 费用，对高频调用场景价值突出
零配置开箱即用：纯 Markdown 行为技能，无需安装依赖或设置 API Key
多语言场景覆盖：提供五种语言的触发词实例，降低误判率
决策逻辑清晰："30 秒专注思考"规则直观易操作，复杂信号列表详尽
双向路由设计：支持升级与降级，避免 conversation 全程滞留高价模型
安全纯净：无可执行代码，无外部依赖，无数据收集行为

潜在缺点与局限性

依赖模型自我判断：分类准确性受限于当前模型的推理能力，存在误判可能
"When in doubt, escalate" 策略保守：过度升级可能抵消成本节省效果
Skill 描述冗长：核心指令挤在 frontmatter 中，影响可读性与维护性
缺乏动态反馈机制：无法根据历史路由效果自我优化阈值
厂商锁定：虽提供 OpenAI/Google 替代映射，但核心设计围绕 Claude 生态
T3 来源可信度：个人开发者项目，长期维护与更新稳定性存疑

适合人群

高频 Claude API 用户：客服、内容平台、自动化工作流等调用量大的场景
成本敏感型团队：初创公司或独立开发者希望优化 AI 预算
多语言产品团队：需要同时处理繁中、日、韩等多语种客服对话
Claude Code 生态用户：已采用 sessions_spawn 等原生 API 的开发者

常规风险

1. 路由误判风险：复杂任务误判为简单任务可能导致输出质量下降，简单任务误判为复杂任务则浪费成本
2. 会话状态碎片化：频繁调用 sessions_spawn 可能增加对话上下文管理的复杂度
3. 延迟累积：模型切换引入额外网络往返，对实时性要求高的场景需评估
4. 版本兼容风险：Claude 模型版本迭代可能导致推荐映射关系过时
5. 缺乏许可证声明：当前未明确开源协议，商业使用需注意合规性

cost-optimization claude model-routing api-management multi-language

Save Money 内容

手动下载zip · 4.5 kB

SKILL.mdtext/markdown

请选择文件