核心能力与用法
Token Optimizer 是一套面向 OpenClaw 部署的综合成本优化工具,通过四大核心策略显著降低 LLM API 支出。
1. 上下文优化(最大收益)
默认 OpenClaw 每次会话加载 50K+ token 的完整上下文。本技能通过 context_optimizer.py 实现懒加载:根据用户提示复杂度智能选择必需文件。简单问候仅加载 2 个文件(SOUL.md + IDENTITY.md),节省 ~80% 上下文 token;标准任务选择性加载记忆文件,节省 ~50%;复杂任务才启用完整上下文。生成优化版 AGENTS.md.optimized 可进一步提升效率。
2. 智能模型路由
model_router.py 自动分类任务并路由至 appropriate 模型层级,强制规定:所有沟通类消息(问候、感谢、确认)必须使用 Haiku,绝不用 Sonnet/Opus;后台任务(日志解析、心跳检查、定时任务)同样强制 Haiku。复杂架构设计才建议 Opus。内置 ROUTING_RULES 和 COMMUNICATION_PATTERNS 可自定义。
3. 心跳优化
heartbeat_optimizer.py 通过追踪上次检查时间、强制最小间隔(邮件 60 分钟、日历 2 小时等)、尊重安静时段(23:00-08:00 跳过检查),实现 50% 的心跳 API 调用削减。返回 HEARTBEAT_OK 无活动时直接节省 token。
4. 预算追踪与多供应商策略
token_tracker.py 监控日预算消耗(ok/warning/exceeded 三级状态),高耗时操作前自动降级模型。PROVIDERS.md 提供 OpenRouter、Together.ai、Google AI Studio 等替代方案,Gemini 2.5 Flash 成本低至 $0.075/MTok,Google AI Studio 更可免费用于开发测试。
部署模式与收益
- 个人使用:优化心跳 + 手动路由,节省 20-30%
- 托管部署:默认 Haiku + 用户交互 Sonnet + 显式复杂请求才用 Opus,节省 40-60%
- 高流量场景:多供应商 fallback + 激进路由(80% Gemini),节省 70-90%
关键数据:10 万次 token/日工作负载,无优化时 $9/月,全套优化后 $2.70/月(70% 节省);激进策略可降至 $0.90/月(90% 节省)。xCloud 100 客户场景月省 $315。
显著优点
- 安全设计:100% 本地文件分析,零网络请求、零代码执行、零子进程调用、零系统修改
- 即插即用:提供现成脚本和模板,无需 OpenClaw 核心改动即可生效
- 量化收益:每项优化均有明确成本测算,ROI 可追踪
- 灵活配置:路由规则、心跳间隔、预算阈值均可自定义
- 审计完备:安全认证报告完整,Morpheus 代码审计通过(2026-02-17)
局限性与风险
- 依赖手动集成:部分高级功能(prompt caching、自动懒加载)需 OpenClaw 核心支持,当前为待集成状态
- 预算追踪限制:
token_tracker.py需手动记录或等待session_status工具集成,无法自动实时解析 - 路由准确性:任务分类基于关键词匹配,边缘案例可能误判,需定期 review 调整规则
- 多供应商复杂度:fallback 链增加运维负担,API 密钥管理和健康监控需额外投入
- 质量权衡:过度激进的路由(如复杂任务误用 Haiku)可能影响输出质量,建议 A/B 测试验证
适合人群
- 高频率 OpenClaw 用户:日均数千次以上交互,成本敏感
- 多代理托管服务商:xCloud 等平台运营者,需规模化成本控制
- 企业合规场景:需预算上限和审计追踪的部署环境
- 开发者测试环境:利用 Gemini 免费额度降低实验成本
常规风险提示
- 模型降级可能导致任务失败或质量下降,关键业务建议保留人工审核
- 心跳间隔过长可能遗漏紧急事件,需根据业务 SLA 调整
- 第三方供应商 API 稳定性不一,生产环境建议保留 Anthropic 主供应商作为 fallback