skills/peterokase42/Save Money

Save Money

🧠 智能模型路由，API 成本省半

开发运维榜 #2

智慧路由模型切换，自动判断任务复杂度，日常用 Haiku 省成本，深度思考才用 Sonnet，API 费用降低 50% 以上。

收藏

24.9k

安装

6k

版本

2.2.0

CLS 安全扫描中

预计需要 3 分钟...

使用说明

核心用法

Save Money 是一套成本优化策略，通过自动检测任务复杂度来决定调用哪个 Claude 模型。核心原则：默认使用 Haiku，仅在实际需要深度思考时升级到 Sonnet。判断标准为「30 秒专注思考规则」——如果人类完成该任务需要超过 30 秒专注思考，就触发升级。

升级触发条件（Sonnet）

分析评估：方案比较、权衡取舍、文档审阅
规划策略：项目计划、路线图、商业模式、架构设计
长文写作：报告、提案、文章、超过 3 段落的邮件
代码生成：功能开发、重构、复杂调试
多步推理：含「首先…然后…最后」或编号步骤的任务
长内容总结：长文档、完整文章、会议记录
长翻译：整段文字或完整文档（非单句）
创意写作：文案、广告脚本、品牌约束下的命名

保持降级条件（Haiku）

事实问答、快速查询（定义、单句翻译、单位换算）
记忆提醒、闲聊问候、状态检查、1-2 句话可完成的任务

进阶省钱技巧

1. 精简输出：Haiku 场景下保持回复简洁，减少输出 token
2. 主动降级：复杂对话后的简单跟进，主动切回 Haiku

显著优点

成本效益明确：声称可节省 50%+ API 费用，ROI 可量化
规则清晰可操作：提供多语言真实对话示例，降低判断门槛
跨平台兼容：提供 Claude/OpenAI/Google 的模型映射表
技术实现简单：通过 sessions_spawn 即可完成模型切换
多语言覆盖：中英日韓德五语言示例，全球化适用

潜在缺点与局限性

规则依赖经验判断：「30 秒思考」标准仍具主观性，边缘案例易误判
无自动检测机制：需人工/Agent 主动判断，无法实现真正的「自动」路由
模型版本锁定：Claude 模型名称硬编码，需手动更新版本号
未考虑延迟成本：频繁切换可能引入额外网络开销
缺乏成本监控：无内置用量追踪或预算预警功能

适合人群

高频使用 Claude API 的开发团队与产品公司
构建 AI Agent 平台、需要精细成本控制的架构师
多语言客服、内容生成等 token 消耗大的应用场景
希望在不牺牲质量前提下优化 AI 支出的中小企业

常规风险

| 风险类型 | 说明 |

|---------|------|

| 误判降级 | 复杂任务被误判为简单任务，导致输出质量下降、需重复请求，反而增加成本 |

| 误判升级 | 简单任务过度使用 Sonnet，造成不必要的费用浪费 |

| 上下文断裂 | 模型切换时若未妥善处理上下文，可能导致对话连贯性受损 |

| 版本过时 | 模型名称随厂商更新而失效，需持续维护 |

| 供应商锁定 | 虽提供多平台映射，但核心逻辑仍围绕 Claude 设计，迁移成本存在 |

cost-optimization model-routing claude api-management multi-language agent-strategy

Save Money 内容

手动下载zip · 3.5 kB

SKILL.mdtext/markdown

请选择文件