Save Money

🧠 智能路由,模型随任务切换,API 成本砍半

自动判断任务复杂度,简单对话用 Haiku、深度任务才升級 Sonnet,API 成本直降 50% 以上,省钱不失质。

收藏
22k
安装
6k
版本
3.0.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

save-money 是一套智能路由规则,让 AI Agent 默认使用便宜的轻量模型(Claude Haiku / GPT-4o-mini / Gemini Flash),仅在侦测到复杂任务时才自动调用更强的模型(Claude Sonnet / GPT-4o / Gemini Pro)。

执行逻辑三步走:
1. 分类优先 — 收到任何请求先判断是否触发「升級条件」

2. 即时升級 — 符合任一触发条件,立即调用 sessions_spawn() 转发给强模型,当前模型不尝试作答

3. 降级回省 — 对话若已升級但后续问题变简单,主动切回便宜模型

升級触发清单涵盖: 分析评估、策略規劃、长文写作、程式生成、多步推理、长文档摘要、专业翻译、创意写作、结构化输出等九大类。同时提供多语言(英/中/日/韩/德)的实例对照表,便于快速判断。

省钱双保险:

  • 轻量模型响应保持极简,减少输出 token
  • 避免「一旦升級就永久停留」的浪费,支持动态降级

---

显著优点

1. 成本效益显著:官方宣称可省 50%+ API 费用,对高频调用场景尤其关键
2. 规则透明可预期:触发条件清单化、多语言实例化,开发者与终端用户都能理解何时会升級

3. 跨平台移植性强:提供 Claude / OpenAI / Google 三家的模型对照表,易于迁移

4. 人机协作友好:「30 秒专注思考法则」让升級决策符合人类直觉

潜在缺点与局限

1. 分类误判风险:边界案例(如「稍长的邮件但内容简单」)可能过度升級或该升未升
2. 延迟成本sessions_spawn 调用产生额外网络往返,对极短对话可能「省下的钱抵不过延迟」

3. 平台依赖性:技能撰写以特定 Agent 架构为前提,非标准 MCP 或通用协议

4. 维护负担:模型版本号(如 anthropic/claude-sonnet-4-20250514)会过期,需持续更新

适合人群

  • 自建 AI Agent 或客服系统的开发者,追求成本精细化管理
  • 多语言团队需要可落地的「复杂度分级」规则
  • Claude 生态用户希望无缝切换至其他 provider

常规风险

  • 误判导致用户体验波动:过度省钱可能让本该升級的任务得到草率回答
  • 供应商绑定:技能深度依赖特定平台的 sessions_spawn 机制,迁移需改写调用逻辑
  • 安全报告缺失:提供的安全认证报告为占位文本,实际部署前需自行评估代码注入、提示注入等风险

Save Money 内容

暂无文件树

手动下载zip · 7.6 kB
contentapplication/octet-stream
请选择文件