使用说明

核心用法

Save Money 是一套智慧模型路由策略，核心理念是「預設用便宜的 Haiku，只在需要時才升級 Sonnet」。透過自動偵測任務複雜度，判斷是否觸發「升級條件」，從而達到成本最佳化。

升級觸發條件

任務類型：分析比較、規劃策略、長篇寫作、程式碼生成、多步驟推理、長文件摘要、長篇翻譯、創意文案
關鍵詞偵測：支援英/繁中/日/韓四語言，如「分析、比較、規劃、設計、寫一篇」等
複雜度訊號：prompt 超過 200 字、多條件約束、要求結構化輸出、專業商業情境

保持低成本情境

事實查詢、快速查閱、單句翻譯、記憶提醒、閒聊對話、狀態檢查、一兩句可回答的任務

顯著優點

| 優點 | 說明 |

|------|------|

| **成本節省 50%+** | Haiku  Sonnet 價差可達 10-20 倍，策略正確時節省效果顯著 |

| **零學習曲線** | 開發者/使用者無需改變使用習慣，由系統自動判斷 |

| **多語言支援** | 內建英、繁中、日、韓四語言觸發詞表 |

| **跨平台相容** | 提供 Claude、OpenAI、Google 三家模型對照表，易於遷移 |

| **透明無感** | 升級過程不主動告知使用者，避免打斷體驗 |

潛在缺點與局限性

| 風險 | 說明 |

|------|------|

| **誤判成本** | 複雜任務被低估留在 Haiku → 輸出品質下降；簡單任務被高估升級 Sonnet → 浪費成本 |

| **規則維護負擔** | 觸發詞表需隨模型演進、語言習慣變化持續更新 |

| **邊界模糊** | 「30 秒思考」規則為經驗法則，不同領域主觀差異大 |

| **延遲權衡** | 複雜任務若先經 Haiku 判斷再升級，可能增加首次回應延遲 |

| **供應商鎖定** | 雖提供對照表，實際整合仍需針對各 API 調整 |

適合人群

AI 應用開發者：需控制 API 成本的 SaaS、Chatbot、自動化流程建置者
企業 IT/採購：評估導入 Claude 或類似服務時的成本控管方案
個人重度使用者：每月 API 花費超過 $50、希望最佳化支出的進階用戶
多語言產品團隊：服務台灣、日本、韓國市場，需要在地化觸發邏輯

常規風險

1. 成本預測不準確：實際節省比例取決於用戶任務分佈，若 80% 任務本就複雜，節省有限
2. 品質一致性風險：同一 prompt 在不同時間可能因規則微調而有不同模型回應
3. 供應商計價變動：Haiku/Sonnet 價差可能隨 Anthropic 定價策略改變
4. 安全與合規：技能文件未提及敏感資料處理、日誌記錄、審計追蹤等企業需求

安全解读

核心用法

Save Money 是一套模型路由决策框架，帮助 AI Agent 在成本与性能之间取得最佳平衡。核心逻辑极其简单：

默认使用 Haiku（低成本模型） 处理日常任务
仅在必要时升级至 Sonnet（强模型） 进行深度思考

判断标准（30 秒法则）

> 如果人类需要超过 30 秒的专注思考，才触发升级。

自动升级信号（触发 Sonnet）：

分析比较、规划策略、长文写作、代码生成
多步骤推理、长文档总结、长篇翻译、创意写作
关键词触发：analyze、plan、build、optimize、「分析」「規劃」「幫我想」「解決方案」等
复杂度指标：prompt > 200 字、多条件约束、结构化输出需求

保持低成本信号（使用 Haiku）：

事实问答、快速查询、单句翻译、记忆提醒
闲聊对话、状态检查、一句话任务
关键词：what is、translate、「是什麼」「翻譯」「記住」等

显著优点

1. 成本优化显著：官方宣称节省 50%+ API 费用，对高频调用场景尤为重要
2. 决策透明：提供明确的任务类型判断表、多语言触发词对照，降低主观判断误差
3. 多厂商适配：除 Claude 外，已预设 OpenAI（gpt-4o-mini / gpt-4o）、Google（gemini-flash / gemini-pro）的对应模型映射
4. 零学习成本：纯文档型 Skill，无需安装依赖，直接参考规则即可实施

潜在缺点与局限性

1. 规则依赖主观判断：「30 秒法则」和触发词仍需人工或 Agent 自行判断，无自动化检测机制
2. 延迟权衡未明确：模型切换本身可能引入额外延迟，未讨论该成本
3. 边缘案例模糊：中等复杂度任务（如 150 字带轻微分析需求）的边界较模糊
4. 无动态学习：固定规则表，无法根据历史调用数据自我优化

适合人群

高频 API 调用者：客服机器人、内容平台、自动化工作流开发者
成本敏感型团队：初创公司、个人开发者、非营利组织
多模型策略实施者：已在 Claude / OpenAI / Google 之间做选型规划的架构师

常规风险

误判降级风险：复杂任务被误判为简单任务，导致输出质量下降
过度保守风险：为避免质量问题而全部使用 Sonnet，失去成本优化意义
提供商锁定：当前代码示例为 Anthropic 格式，迁移需手动调整 sessions_spawn 调用

安全评估

该 Skill 为纯 Markdown 文档（T-MD 分类），无任何可执行代码、无外部 API 调用、无数据收集。安全等级 S+，通过 GDPR/CCPA 合规检查，可放心使用。

cost-optimization model-routing claude api-cost multi-language enterprise developer-tool llm-strategy automation

Save Money 内容

手动下载zip · 2.7 kB

SKILL.mdtext/markdown

请选择文件