Save Money

🧠 智能路由省 50% API 费用

智能路由模型调用,自动识别任务复杂度,日常用 Haiku、深度思考才用 Sonnet,API 成本节省 50% 以上。

收藏
23.3k
安装
6k
版本
2.0.1
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

Save Money 是一套成本优化的智能路由规则,核心理念是「默认跑便宜模型,需要时才升级」。系统以 Claude Haiku 为默认模型,仅在检测到任务复杂度达标时才自动切换至 Sonnet,避免为简单查询支付高额 token 费用。

自动升级触发条件(需 30 秒以上深度思考)

| 任务类型 | 示例 |
|---------|------|
| 分析评估 | 选项比较、风险评估、文档审阅 |
| 规划策略 | 项目计划、路线图、商业模型设计 |
| 长文写作 | 报告、提案、>3 段落的邮件 |
| 代码生成 | 功能开发、重构、复杂调试 |
| 多步推理 | 含步骤顺序的逻辑链条 |
| 大内容总结 | 长文档、完整会议记录 |
| 长翻译 | 段落或全文翻译 |
| 创意写作 | 品牌约束下的文案、命名 |

关键词自动识别(多语言支持)

  • 升级信号:analyze/分析/分析して、plan/規劃/計画を立てて、build/建立/作成して、"step by step" 等
  • 保持信号:what is/是什麼/とは、define/查一下/教えて、简短翻译等

技术实现

sessions_spawn(message, model="anthropic/claude-sonnet-4-20250514", label)

支持 Claude、OpenAI、Google 三厂商模型映射替换。

显著优点

1. 成本效益明确:宣称节省 50%+ API 费用,ROI 可量化
2. 规则清晰可执行:「30 秒思考法则」直观易懂,触发条件具体

3. 多语言原生支持:中英日韩四语关键词覆盖,适合国际化场景

4. 零侵入设计:模型切换对用户透明,不破坏交互体验

5. 厂商无关架构:规则抽象层可迁移至任意 LLM 平台

潜在缺点与局限

  • 复杂度判断主观:「30 秒法则」依赖实现者的经验,边缘案例易误判
  • 延迟权衡:升级触发增加一次模型调用决策延迟
  • 模型能力漂移:Haiku/Sonnet 能力边界随版本更新变化,规则需持续维护
  • 多轮对话累积成本:复杂任务若分多轮简单查询,可能反而因重复升级更贵
  • 中文场景优化不足:繁体中文示例为主,简体中文用词习惯略有差异

适合人群

  • 高频调用 API 的 AI 应用开发者与产品经理
  • 成本敏感的企业级 Claude 用户
  • 需要为终端用户透明优化成本的 Agent 架构师
  • 多语言客服、内容平台等技术团队

常规风险

| 风险等级 | 描述 |
|---------|------|
| 中等 | 误判导致该用强模型时降级,输出质量受损 |
| 低 | 过度升级导致成本优化失效 |
| 低 | 厂商模型命名变更导致配置失效(需维护映射表) |

Save Money 内容

暂无文件树

手动下载zip · 2.6 kB
contentapplication/octet-stream
请选择文件