核心用法
save-money 是一套智能路由规则,让 AI Agent 默认使用便宜的轻量模型(Claude Haiku / GPT-4o-mini / Gemini Flash),仅在侦测到复杂任务时才自动调用更强的模型(Claude Sonnet / GPT-4o / Gemini Pro)。
执行逻辑三步走:
1. 分类优先 — 收到任何请求先判断是否触发「升級条件」
2. 即时升級 — 符合任一触发条件,立即调用 sessions_spawn() 转发给强模型,当前模型不尝试作答
3. 降级回省 — 对话若已升級但后续问题变简单,主动切回便宜模型
升級触发清单涵盖: 分析评估、策略規劃、长文写作、程式生成、多步推理、长文档摘要、专业翻译、创意写作、结构化输出等九大类。同时提供多语言(英/中/日/韩/德)的实例对照表,便于快速判断。
省钱双保险:
- 轻量模型响应保持极简,减少输出 token
- 避免「一旦升級就永久停留」的浪费,支持动态降级
---
显著优点
1. 成本效益显著:官方宣称可省 50%+ API 费用,对高频调用场景尤其关键
2. 规则透明可预期:触发条件清单化、多语言实例化,开发者与终端用户都能理解何时会升級
3. 跨平台移植性强:提供 Claude / OpenAI / Google 三家的模型对照表,易于迁移
4. 人机协作友好:「30 秒专注思考法则」让升級决策符合人类直觉
潜在缺点与局限
1. 分类误判风险:边界案例(如「稍长的邮件但内容简单」)可能过度升級或该升未升
2. 延迟成本:sessions_spawn 调用产生额外网络往返,对极短对话可能「省下的钱抵不过延迟」
3. 平台依赖性:技能撰写以特定 Agent 架构为前提,非标准 MCP 或通用协议
4. 维护负担:模型版本号(如 anthropic/claude-sonnet-4-20250514)会过期,需持续更新
适合人群
- 自建 AI Agent 或客服系统的开发者,追求成本精细化管理
- 多语言团队需要可落地的「复杂度分级」规则
- Claude 生态用户希望无缝切换至其他 provider
常规风险
- 误判导致用户体验波动:过度省钱可能让本该升級的任务得到草率回答
- 供应商绑定:技能深度依赖特定平台的
sessions_spawn机制,迁移需改写调用逻辑 - 安全报告缺失:提供的安全认证报告为占位文本,实际部署前需自行评估代码注入、提示注入等风险