核心用法
Save Money 是一款成本优化型 Agent Skill,通过「自动任务分级 + 智能模型路由」机制,将简单对话导向轻量级模型(Claude Haiku),复杂任务升级至高性能模型(Claude Sonnet)。用户无需手动选择模型,系统依据任务特征自动判断:
- 降级触发词:事实问答、单句翻译、天气查询、问候闲聊、简单提醒等 → 直连 Haiku
- 升级触发词:分析报告、代码生成(>10 行)、多步骤推理、长文撰写(>3 段)、对比表格、策略规划等 → 自动调用
sessions_spawn 转交 Sonnet
关键指令遵循「30 秒法则」——若人类需专注思考超过 30 秒才能完成的任务,必须升级模型。
显著优点
| 维度 | 价值 |
|------|------|
| **成本效益** | 典型场景节省 50%+ API 费用,轻量任务 token 消耗仅为 Sonnet 的 1/5-1/10 |
| **零摩擦体验** | 用户无需理解模型差异,自然语言交互中自动完成路由决策 |
| **透明可审计** | 纯 Markdown 文档型 Skill,无黑盒代码,策略逻辑完全可见 |
| **多语言支持** | 内置中英日韩德五种语言的触发词示例,覆盖全球化团队需求 |
| **弹性回退** | 支持「升级后降级」——复杂对话后的简单跟进自动切回 Haiku |
| **供应商解耦** | 模型名称可映射至 OpenAI(GPT-4o mini/GPT-4o)、Google(Gemini Flash/Pro)等 |
潜在局限
1. 误判成本:复杂任务若被误判为简单任务,Haiku 可能输出低质量结果,反而浪费用户时间;策略建议「有疑即升级」以保守换可靠
2. 延迟开销:每次升级调用 sessions_spawn 产生额外上下文切换延迟(约 100-300ms)
3. 语言覆盖盲区:非五门预设语言的任务分类依赖通用启发规则,准确率可能下降
4. 无持久记忆:任务分级决策为单轮状态,不跨会话继承历史复杂度评估
5. T3 来源风险:开发者为个人 GitHub 账号,虽代码透明但缺乏企业级维护承诺
适合人群
- AI 应用开发者:需在生产环境优化多模型调用成本
- 企业采购/运营团队:希望降低 Claude/OpenAI API 账单,同时保持用户体验
- 多 Agent 架构设计者:构建「路由层 + 执行层」分离的复杂系统
- 非技术管理者:希望获得「自动省钱」能力而无需深入理解模型技术细节
常规风险
- 过度升级风险:保守策略可能导致部分可 Haiku 处理的任务被送 Sonnet,实际节省率可能低于理论 50%
- 模型版本漂移:Claude Haiku/Sonnet 版本更新可能改变能力边界,需定期校准触发规则
- 跨平台兼容性:
sessions_spawn 为特定平台函数,迁移至其他 Agent 框架需重写路由机制 - 提示词工程依赖:最终效果受底层模型指令遵循能力影响,极端案例可能出现「拒升级」或「虚假升级」