OpenClaw Token Optimizer

💰 智能降本,让 AI 代理更省钱

开发者工具榜 #2

通过智能模型路由、上下文懒加载和预算追踪,帮助 OpenClaw 用户降低 50-80% 的 token 消耗与 API 成本,适用于个人到企业级多代理部署场景。

收藏
48k
安装
9.9k
版本
1.2.10
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心功能

Token Optimizer 是一套面向 OpenClaw 生态的综合成本优化工具集,专注于四大核心能力:

1. 上下文懒加载(最大收益)

  • 默认 OpenClaw 每次会话加载 50K+ tokens 的完整上下文
  • 通过 context_optimizer.py 实现按需加载:简单问候仅加载 2 个文件(节省 80%),复杂任务才加载完整文档
  • 生成优化版 AGENTS.md 供替换使用

2. 智能模型路由

  • model_router.py 自动识别任务复杂度,推荐 Haiku/Sonnet/Opus
  • 强制规则:所有寒暄、感谢、确认类消息一律路由至最便宜的 Haiku,杜绝浪费
  • 背景任务(日志解析、心跳检测)同样强制使用低成本模型

3. 心跳与定时任务优化

  • heartbeat_optimizer.py 实现智能轮询间隔(邮件 60 分钟、天气 4 小时),夜间静默期自动跳过
  • 定时任务指南强制 90% 场景使用 Haiku,避免 Opus 用于简单检查

4. 预算管控与多供应商策略

  • token_tracker.py 实时监控日消费,超支时自动降级模型
  • 支持 OpenRouter、Together.ai、Google AI Studio 等备选,Gemini Flash 免费层适合开发测试

显著优点

  • 量化收益明确:典型场景可降本 50-80%,100 客户规模的托管部署月省 $315
  • 零配置快速启动:4 条命令即可运行,无需修改 OpenClaw 核心
  • 安全纯本地:仅分析文件,无网络请求、无代码执行、无系统修改
  • 渐进式采用:个人用户可只启用心跳优化,企业用户可全量部署

局限性与注意事项

  • 部分高级功能(prompt 缓存、核心层懒加载)需等待 OpenClaw 官方支持
  • 预算追踪目前依赖手动记录,未自动对接 session_status API
  • 模型路由规则需根据实际业务微调,初期可能存在误分类
  • Gemini 等替代供应商的输出质量与 Anthropic 模型存在差异,需权衡成本与效果

适合人群

  • 个人开发者:月消费 $5-20,希望控制在 $5 以内
  • 托管服务商(xCloud 等):多租户场景下需要按客户实施预算硬限制
  • 高频自动化场景:大量定时任务、监控告警、日志处理等后台工作流

常规风险

  • 过度激进的成本削减可能导致响应质量下降,建议保留 Sonnet 作为复杂请求的兜底
  • 多供应商切换涉及 API 密钥管理,需遵循最小权限原则
  • 状态文件持久化依赖本地目录权限,容器化部署时需确保卷挂载正确

OpenClaw Token Optimizer 内容

暂无文件树

手动下载zip · 28.4 kB
contentapplication/octet-stream
请选择文件