使用说明

核心用法

Save Money 是一套模型调度策略技能，核心机制是「預設便宜、按需升級」：

預設模型：日常對話使用 Claude Haiku（或其他廠商的輕量模型如 GPT-4o-mini、Gemini Flash）
升級條件：當任務需要「超過30秒專注思考」時，自動切換至 Claude Sonnet（或 GPT-4o、Gemini Pro）
降級機制：複雜任務完成後的簡單追問，自動切回輕量模型

升級觸發條件

| 類別 | 具體場景 |

|------|---------|

| 分析評估 | 方案比較、權衡分析、文件審閱 |

| 規劃策略 | 專案計畫、商業模式、系統架構 |

| 長文寫作 | 報告、提案、簡報、3段落以上郵件 |

| 程式生成 | 函式撰寫、功能開發、複雜除錯 |

| 多步推理 | 具「首先→然後→最後」結構的任務 |

| 長內容處理 | 長文件摘要、會議逐字稿整理 |

| 創意寫作 | 文案、腳本、品牌命名 |

保留輕量模型的場景

事實問答（"什麼是OKR"）
快速查詢（定義、短翻譯、單位換算）
記憶提醒（"記住明天開會"）
閒聊問候
狀態查詢（行事曆、簡單檔案讀取）

顯著優點

1. 成本效益明確：官方宣稱節省50%+ API費用，輕量模型輸出token計價僅為強力模型的10-20%
2. 判斷邏輯透明：提供多語言實例對照表（英/中/日/韓），降低誤判機率
3. 雙向調度：不僅能升級，也強調「降級」機制，避免對話後續簡單提問持續占用高價模型
4. 跨平台適配：表格列出 Claude、OpenAI、Google 的對應模型名稱，便於遷移

潛在缺點與局限性

1. 延遲判斷成本：模型切換本身需要額外調度時間，極短對話可能得不償失
2. 邊界模糊：「30秒思考」是主觀標準，實際部署時需持續校準；某些任務（如「簡短翻譯專業術語」）可能介於兩者之間
3. 無自動化機制：技能僅提供策略框架，需開發者自行實現 sessions_spawn 呼叫邏輯
4. 缺乏回饋迴路：未提及如何根據實際輸出品質調整路由規則，可能累積誤判成本

適合人群

AI 應用開發者：建構多模型路由的中介層（router / gateway）
企業成本控制隊：需量化 API 支出的產品經理或維運人員
高頻對話場景：客服、個人助理、教育輔導等每日數千次呼叫的應用
多語言產品團隊：已支援英中日韓四語言的判斷範例

常規風險

品質不一致風險：過度依賴輕量模型可能導致關鍵任務輸出品質下降，需建立降級逃生閥
用戶體驗落差：若切換邏輯不透明，用戶可能察覺「有時很聰明、有時很笨」的回覆差異
供應商鎖定：雖提供跨平台對照表，但判斷邏輯仍基於 Claude 的 Haiku/Sonnet 特性設計，遷移時需重新校準

安全解读

核心用法

Save Money 是一套模型路由策略指导文档，核心理念是「按需升级」：默认使用轻量级 Haiku 处理日常对话，仅在任务真正需要深度推理时才自动切换至 Sonnet。用户无需手动选择模型，系统通过任务类型、提问方式、复杂度信号三维度自动判断。

升级触发条件（满足任一即可）：

任务类型：分析评估、策略规划、长文写作、代码生成、多步推理、长文档总结、长翻译、创意写作
提问关键词：「分析」「报告」「规划」「比较」「步骤」「设计」「帮我写」等
复杂度信号：prompt 超过 200 字、含多条件约束、要求结构化输出、专业场景（提案/简历/合同）

保持 Haiku 场景：事实问答、快速查询、单句翻译、记忆提醒、寒暄对话、状态检查、一句话任务。

进阶省钱技巧：Haiku 下保持回复简短；对话降级后主动切回 Haiku，避免全程占用高价模型。

显著优点

1. 成本效益明确：官方宣称可节省 50%+ API 费用，对高频调用场景价值显著
2. 规则清晰可落地：「30 秒专注思考」黄金法则简单直观，多语言示例覆盖中英日韩
3. 技术无关设计：文档同时提供 Claude、OpenAI、Google 三家的模型映射表，跨平台通用
4. 无侵入零依赖：纯 Markdown 文档型 Skill，无需安装、无代码执行、无隐私风险
5. 维护活跃：GitHub 仓库持续更新（2026-03 最后更新），社区有一定认可度（45 stars）

潜在缺点与局限性

1. 非自动化实现：仅为策略文档，非真正「自动侦测」系统，需依赖宿主平台或手动配置
2. 判断边界模糊：「30 秒思考」「200 字符」等阈值偏主观，实际执行中可能误判
3. 语言示例有限：虽覆盖四种语言，但小语种或混合语言场景覆盖不足
4. 无动态学习：无法根据历史调用数据优化路由决策，策略固定
5. 降级依赖人工：文档建议「主动切回 Haiku」，但未提供自动降级机制

适合人群

高频使用 Claude API 的开发者与团队
希望优化 LLM 调用成本的 AI 应用架构师
需要向非技术人员解释「为何有时慢有时快」的产品经理
多模型混合部署场景的运维人员

常规风险

策略误用风险：若平台未按文档实现路由，可能导致全程使用 Sonnet 或 Haiku 处理不了复杂任务
阈值僵化：固定字符数/思考时间阈值可能不适应特定业务场景
版本滞后：模型映射表需随厂商更新手动同步，存在过期风险

cost-optimization model-routing claude api-gateway multi-model token-saving enterprise-efficiency i18n

Save Money 内容

手动下载zip · 3.2 kB

SKILL.mdtext/markdown

请选择文件