核心用法
Save Money 是一套智慧模型路由策略,核心理念是「預設用便宜的 Haiku,只在需要時才升級 Sonnet」。透過自動偵測任務複雜度,判斷是否觸發「升級條件」,從而達到成本最佳化。
升級觸發條件
- 任務類型:分析比較、規劃策略、長篇寫作、程式碼生成、多步驟推理、長文件摘要、長篇翻譯、創意文案
- 關鍵詞偵測:支援英/繁中/日/韓四語言,如「分析、比較、規劃、設計、寫一篇」等
- 複雜度訊號:prompt 超過 200 字、多條件約束、要求結構化輸出、專業商業情境
保持低成本情境
- 事實查詢、快速查閱、單句翻譯、記憶提醒、閒聊對話、狀態檢查、一兩句可回答的任務
顯著優點
| 優點 | 說明 |
|------|------|
| **成本節省 50%+** | Haiku Sonnet 價差可達 10-20 倍,策略正確時節省效果顯著 |
| **零學習曲線** | 開發者/使用者無需改變使用習慣,由系統自動判斷 |
| **多語言支援** | 內建英、繁中、日、韓四語言觸發詞表 |
| **跨平台相容** | 提供 Claude、OpenAI、Google 三家模型對照表,易於遷移 |
| **透明無感** | 升級過程不主動告知使用者,避免打斷體驗 |
潛在缺點與局限性
| 風險 | 說明 |
|------|------|
| **誤判成本** | 複雜任務被低估留在 Haiku → 輸出品質下降;簡單任務被高估升級 Sonnet → 浪費成本 |
| **規則維護負擔** | 觸發詞表需隨模型演進、語言習慣變化持續更新 |
| **邊界模糊** | 「30 秒思考」規則為經驗法則,不同領域主觀差異大 |
| **延遲權衡** | 複雜任務若先經 Haiku 判斷再升級,可能增加首次回應延遲 |
| **供應商鎖定** | 雖提供對照表,實際整合仍需針對各 API 調整 |
適合人群
- AI 應用開發者:需控制 API 成本的 SaaS、Chatbot、自動化流程建置者
- 企業 IT/採購:評估導入 Claude 或類似服務時的成本控管方案
- 個人重度使用者:每月 API 花費超過 $50、希望最佳化支出的進階用戶
- 多語言產品團隊:服務台灣、日本、韓國市場,需要在地化觸發邏輯
常規風險
1. 成本預測不準確:實際節省比例取決於用戶任務分佈,若 80% 任務本就複雜,節省有限
2. 品質一致性風險:同一 prompt 在不同時間可能因規則微調而有不同模型回應
3. 供應商計價變動:Haiku/Sonnet 價差可能隨 Anthropic 定價策略改變
4. 安全與合規:技能文件未提及敏感資料處理、日誌記錄、審計追蹤等企業需求