核心用法
Save Money 是一套成本优化的智能路由规则,核心理念是「默认跑便宜模型,需要时才升级」。系统以 Claude Haiku 为默认模型,仅在检测到任务复杂度达标时才自动切换至 Sonnet,避免为简单查询支付高额 token 费用。
自动升级触发条件(需 30 秒以上深度思考)
| 任务类型 | 示例 |
|---------|------|
| 分析评估 | 选项比较、风险评估、文档审阅 |
| 规划策略 | 项目计划、路线图、商业模型设计 |
| 长文写作 | 报告、提案、>3 段落的邮件 |
| 代码生成 | 功能开发、重构、复杂调试 |
| 多步推理 | 含步骤顺序的逻辑链条 |
| 大内容总结 | 长文档、完整会议记录 |
| 长翻译 | 段落或全文翻译 |
| 创意写作 | 品牌约束下的文案、命名 |
关键词自动识别(多语言支持)
- 升级信号:analyze/分析/分析して、plan/規劃/計画を立てて、build/建立/作成して、"step by step" 等
- 保持信号:what is/是什麼/とは、define/查一下/教えて、简短翻译等
技术实现
sessions_spawn(message, model="anthropic/claude-sonnet-4-20250514", label)
支持 Claude、OpenAI、Google 三厂商模型映射替换。
显著优点
1. 成本效益明确:宣称节省 50%+ API 费用,ROI 可量化
2. 规则清晰可执行:「30 秒思考法则」直观易懂,触发条件具体
3. 多语言原生支持:中英日韩四语关键词覆盖,适合国际化场景
4. 零侵入设计:模型切换对用户透明,不破坏交互体验
5. 厂商无关架构:规则抽象层可迁移至任意 LLM 平台
潜在缺点与局限
- 复杂度判断主观:「30 秒法则」依赖实现者的经验,边缘案例易误判
- 延迟权衡:升级触发增加一次模型调用决策延迟
- 模型能力漂移:Haiku/Sonnet 能力边界随版本更新变化,规则需持续维护
- 多轮对话累积成本:复杂任务若分多轮简单查询,可能反而因重复升级更贵
- 中文场景优化不足:繁体中文示例为主,简体中文用词习惯略有差异
适合人群
- 高频调用 API 的 AI 应用开发者与产品经理
- 成本敏感的企业级 Claude 用户
- 需要为终端用户透明优化成本的 Agent 架构师
- 多语言客服、内容平台等技术团队
常规风险
| 风险等级 | 描述 |
|---------|------|
| 中等 | 误判导致该用强模型时降级,输出质量受损 |
| 低 | 过度升级导致成本优化失效 |
| 低 | 厂商模型命名变更导致配置失效(需维护映射表) |