Save Money

🧠 智能路由,模型随任务切换,API 成本砍半

自动判断任务复杂度,简单对话用 Haiku、深度任务才升級 Sonnet,API 成本直降 50% 以上,省钱不失质。

收藏
22k
安装
6k
版本
3.0.0
CLS 安全性认证2026-05-21
点击查看完整报告 >

使用说明

核心用法

save-money 是一套智能路由规则,让 AI Agent 默认使用便宜的轻量模型(Claude Haiku / GPT-4o-mini / Gemini Flash),仅在侦测到复杂任务时才自动调用更强的模型(Claude Sonnet / GPT-4o / Gemini Pro)。

执行逻辑三步走:
1. 分类优先 — 收到任何请求先判断是否触发「升級条件」

2. 即时升級 — 符合任一触发条件,立即调用 sessions_spawn() 转发给强模型,当前模型不尝试作答

3. 降级回省 — 对话若已升級但后续问题变简单,主动切回便宜模型

升級触发清单涵盖: 分析评估、策略規劃、长文写作、程式生成、多步推理、长文档摘要、专业翻译、创意写作、结构化输出等九大类。同时提供多语言(英/中/日/韩/德)的实例对照表,便于快速判断。

省钱双保险:

  • 轻量模型响应保持极简,减少输出 token
  • 避免「一旦升級就永久停留」的浪费,支持动态降级

---

显著优点

1. 成本效益显著:官方宣称可省 50%+ API 费用,对高频调用场景尤其关键
2. 规则透明可预期:触发条件清单化、多语言实例化,开发者与终端用户都能理解何时会升級

3. 跨平台移植性强:提供 Claude / OpenAI / Google 三家的模型对照表,易于迁移

4. 人机协作友好:「30 秒专注思考法则」让升級决策符合人类直觉

潜在缺点与局限

1. 分类误判风险:边界案例(如「稍长的邮件但内容简单」)可能过度升級或该升未升
2. 延迟成本sessions_spawn 调用产生额外网络往返,对极短对话可能「省下的钱抵不过延迟」

3. 平台依赖性:技能撰写以特定 Agent 架构为前提,非标准 MCP 或通用协议

4. 维护负担:模型版本号(如 anthropic/claude-sonnet-4-20250514)会过期,需持续更新

适合人群

  • 自建 AI Agent 或客服系统的开发者,追求成本精细化管理
  • 多语言团队需要可落地的「复杂度分级」规则
  • Claude 生态用户希望无缝切换至其他 provider

常规风险

  • 误判导致用户体验波动:过度省钱可能让本该升級的任务得到草率回答
  • 供应商绑定:技能深度依赖特定平台的 sessions_spawn 机制,迁移需改写调用逻辑
  • 安全报告缺失:提供的安全认证报告为占位文本,实际部署前需自行评估代码注入、提示注入等风险

安全解读

核心功能

Save Money 是一套模型智能路由决策框架,通过提示词工程让 AI Agent 自动判断任务复杂度,在低成本模型(Claude Haiku)与高性能模型(Claude Sonnet)之间动态切换,实现 API 成本优化目标。

核心用法

1. 分类优先原则:任何响应生成前,先检查是否触发升级条件
2. 30 秒规则:若人类需要超过 30 秒专注思考才能完成的任务,必须升级

3. 明确触发清单:涵盖分析评估、规划策略、长文写作、代码生成、多步推理、长翻译、创意写作、结构化输出等 8 大场景

4. 降级回切机制:复杂任务完成后,后续简单对话自动切回便宜模型

显著优点

  • 成本效益明确:官方宣称可节省 50%+ 费用,逻辑合理(Haiku 定价约为 Sonnet 的 1/10)
  • 决策框架清晰:将模糊的"任务复杂度"转化为可操作的检查清单
  • 多语言示例丰富:提供英、繁中、日、韩、德五种语言的实际对话范例
  • 零技术门槛:纯 Markdown 文档型 Skill,无需安装或配置
  • 供应商可迁移:提供 OpenAI、Google 模型的对应替代方案

潜在局限

  • 依赖自我约束:需要 Agent 严格遵循提示词规则,实际执行存在偏差风险
  • 边界判断模糊:"30 秒思考""3 段以上"等标准存在主观解释空间
  • 无法强制降级:需依赖对话历史判断,跨会话场景可能失效
  • Claude 生态限定:原生为 Anthropic 模型设计,其他平台需手动映射

适合人群

  • 高频使用 Claude API 的开发者与团队
  • 需要平衡成本与质量的 AI 应用产品经理
  • 构建多 Agent 系统的架构师
  • 对 token 消耗敏感的长期用户

使用风险

  • 过度降级风险:Agent 可能误判复杂度,用 Haiku 硬答导致输出质量下降
  • 延迟累积:频繁调用 sessions_spawn 可能引入额外网络延迟
  • 上下文割裂:模型切换可能导致会话状态丢失
  • 功能无保障:作为文档型 Skill,无法强制执行路由决策,实际效果取决于 Agent 实现

Save Money 内容

手动下载zip · 7.6 kB
SKILL.mdtext/markdown
请选择文件