核心用法
Save Money 是一套智能模型路由框架,核心理念是"按需分配":默认使用轻量模型(Claude Haiku)处理日常对话,仅在检测到复杂任务时自动升级至强模型(Claude Sonnet)。
路由判断逻辑
技能采用三重信号检测机制:
- 任务类型识别:分析评估、规划策略、长文写作、代码生成、多步推理等自动触发升级
- 关键词触发:支持英/繁中/日/韩四语言的关键词库,如"分析""規劃""step by step"等
- 复杂度信号:Prompt长度>200字符、多条件约束、结构化输出需求等
执行方式
通过 sessions_spawn() 函数静默切换模型,用户无感知,不暴露底层实现。
显著优点
1. 成本优化显著:官方宣称可节省50%+ API费用,高频场景下ROI极高
2. 响应速度提升:简单任务用Haiku延迟更低,体验更流畅
3. 多语言原生支持:繁体中文、日语、韩语关键词库完善,非英语用户友好
4. 跨平台可迁移:提供OpenAI、Google Gemini的模型映射表,便于迁移
5. 判断标准清晰:"30秒专注思考"原则直观易懂,降低主观判断成本
潜在缺点与局限性
- 误判风险:边界任务(如中等长度翻译)可能路由不当,影响质量或浪费成本
- 延迟累积:复杂任务需spawn新session,可能增加端到端延迟
- 供应商锁定:当前实现依赖特定MCP架构,非标准接口
- 维护负担:关键词库需持续更新,新任务类型可能漏检
- 无反馈机制:未提及如何根据实际消耗优化路由策略
适合人群
- 日均API调用量>100次的企业/开发者
- 成本敏感但不愿牺牲复杂任务质量的团队
- 多语言客服、内容审核等高频场景
- 已使用Claude API且熟悉MCP架构的用户
常规风险
| 风险类型 | 说明 |
|---------|------|
| 路由误判 | 简单任务误升级→成本浪费;复杂任务未升级→输出质量下降 |
| 供应商变更 | Claude模型版本迭代可能需同步更新skill |
| 隐私合规 | spawn新session可能涉及数据跨境,需确认服务商合规性 |
| 过度依赖 | 长期自动路由可能削弱人工判断复杂度的能力 |