核心功能
Token Optimizer 是一套面向 OpenClaw 生态的综合成本优化工具集,专注于四大核心能力:
1. 上下文懒加载(最大收益)
- 默认 OpenClaw 每次会话加载 50K+ tokens 的完整上下文
- 通过
context_optimizer.py实现按需加载:简单问候仅加载 2 个文件(节省 80%),复杂任务才加载完整文档 - 生成优化版
AGENTS.md供替换使用
2. 智能模型路由
model_router.py自动识别任务复杂度,推荐 Haiku/Sonnet/Opus- 强制规则:所有寒暄、感谢、确认类消息一律路由至最便宜的 Haiku,杜绝浪费
- 背景任务(日志解析、心跳检测)同样强制使用低成本模型
3. 心跳与定时任务优化
heartbeat_optimizer.py实现智能轮询间隔(邮件 60 分钟、天气 4 小时),夜间静默期自动跳过- 定时任务指南强制 90% 场景使用 Haiku,避免 Opus 用于简单检查
4. 预算管控与多供应商策略
token_tracker.py实时监控日消费,超支时自动降级模型- 支持 OpenRouter、Together.ai、Google AI Studio 等备选,Gemini Flash 免费层适合开发测试
显著优点
- 量化收益明确:典型场景可降本 50-80%,100 客户规模的托管部署月省 $315
- 零配置快速启动:4 条命令即可运行,无需修改 OpenClaw 核心
- 安全纯本地:仅分析文件,无网络请求、无代码执行、无系统修改
- 渐进式采用:个人用户可只启用心跳优化,企业用户可全量部署
局限性与注意事项
- 部分高级功能(prompt 缓存、核心层懒加载)需等待 OpenClaw 官方支持
- 预算追踪目前依赖手动记录,未自动对接
session_statusAPI - 模型路由规则需根据实际业务微调,初期可能存在误分类
- Gemini 等替代供应商的输出质量与 Anthropic 模型存在差异,需权衡成本与效果
适合人群
- 个人开发者:月消费 $5-20,希望控制在 $5 以内
- 托管服务商(xCloud 等):多租户场景下需要按客户实施预算硬限制
- 高频自动化场景:大量定时任务、监控告警、日志处理等后台工作流
常规风险
- 过度激进的成本削减可能导致响应质量下降,建议保留 Sonnet 作为复杂请求的兜底
- 多供应商切换涉及 API 密钥管理,需遵循最小权限原则
- 状态文件持久化依赖本地目录权限,容器化部署时需确保卷挂载正确