核心用法
Save Money 是一套模型调度策略技能,核心机制是「預設便宜、按需升級」:
- 預設模型:日常對話使用 Claude Haiku(或其他廠商的輕量模型如 GPT-4o-mini、Gemini Flash)
- 升級條件:當任務需要「超過30秒專注思考」時,自動切換至 Claude Sonnet(或 GPT-4o、Gemini Pro)
- 降級機制:複雜任務完成後的簡單追問,自動切回輕量模型
升級觸發條件
| 類別 | 具體場景 |
|------|---------|
| 分析評估 | 方案比較、權衡分析、文件審閱 |
| 規劃策略 | 專案計畫、商業模式、系統架構 |
| 長文寫作 | 報告、提案、簡報、3段落以上郵件 |
| 程式生成 | 函式撰寫、功能開發、複雜除錯 |
| 多步推理 | 具「首先→然後→最後」結構的任務 |
| 長內容處理 | 長文件摘要、會議逐字稿整理 |
| 創意寫作 | 文案、腳本、品牌命名 |
保留輕量模型的場景
- 事實問答("什麼是OKR")
- 快速查詢(定義、短翻譯、單位換算)
- 記憶提醒("記住明天開會")
- 閒聊問候
- 狀態查詢(行事曆、簡單檔案讀取)
顯著優點
1. 成本效益明確:官方宣稱節省50%+ API費用,輕量模型輸出token計價僅為強力模型的10-20%
2. 判斷邏輯透明:提供多語言實例對照表(英/中/日/韓),降低誤判機率
3. 雙向調度:不僅能升級,也強調「降級」機制,避免對話後續簡單提問持續占用高價模型
4. 跨平台適配:表格列出 Claude、OpenAI、Google 的對應模型名稱,便於遷移
潛在缺點與局限性
1. 延遲判斷成本:模型切換本身需要額外調度時間,極短對話可能得不償失
2. 邊界模糊:「30秒思考」是主觀標準,實際部署時需持續校準;某些任務(如「簡短翻譯專業術語」)可能介於兩者之間
3. 無自動化機制:技能僅提供策略框架,需開發者自行實現 sessions_spawn 呼叫邏輯
4. 缺乏回饋迴路:未提及如何根據實際輸出品質調整路由規則,可能累積誤判成本
適合人群
- AI 應用開發者:建構多模型路由的中介層(router / gateway)
- 企業成本控制隊:需量化 API 支出的產品經理或維運人員
- 高頻對話場景:客服、個人助理、教育輔導等每日數千次呼叫的應用
- 多語言產品團隊:已支援英中日韓四語言的判斷範例
常規風險
- 品質不一致風險:過度依賴輕量模型可能導致關鍵任務輸出品質下降,需建立降級逃生閥
- 用戶體驗落差:若切換邏輯不透明,用戶可能察覺「有時很聰明、有時很笨」的回覆差異
- 供應商鎖定:雖提供跨平台對照表,但判斷邏輯仍基於 Claude 的 Haiku/Sonnet 特性設計,遷移時需重新校準