OpenClaw Token Optimizer

🪙 智能路由与懒加载,削减 70% API 成本

通过智能模型路由、上下文懒加载和心跳优化,将 OpenClaw 令牌成本降低 50-90%,适合高成本场景与规模化部署

收藏
32.4k
安装
9.9k
版本
3.0.0
CLS 安全性认证2026-05-11
点击查看完整报告 >

使用说明

核心功能与使用方式

Token Optimizer 是一套专为 OpenClaw 生态设计的成本优化工具集,通过四大核心脚本实现令牌全生命周期管理:

1. Context Optimizer — 革命性的懒加载模式。不再一次性注入 50K+ 令牌的完整上下文,而是根据用户输入智能推荐所需文件(简单问候仅需 2 个文件),实测可削减 80-93% 的上下文令牌消耗。

2. Model Router — 自动任务分级与模型路由。强制将"hi/thanks/ok"等通信类交互路由至最便宜的 Haiku(从不用 Sonnet/Opus),背景任务(日志解析、监控检查)同样强制 Haiku,复杂任务才启用 Opus。

3. Heartbeat Optimizer — 智能轮询间隔管理。默认 55 分钟间隔(对齐 Anthropic 1 小时缓存 TTL),避免缓存失效导致的昂贵重写;支持安静时段跳过、最小间隔强制等机制。

4. Token Tracker — 日常预算监控与预警,支持每日限额、使用百分比追踪和模型降级建议。

显著优点

  • 效果量化明确:官方成本估算显示,100K 令牌/日工作负载可从 $9/月降至 $2.7/月(70% 节省),激进方案可达 90%
  • 零依赖安全:4 个核心脚本仅使用 Python 标准库,无网络请求、无子进程调用、无系统修改
  • 渐进式采用:无需修改配置即可开始使用(context_optimizer.py recommendgenerate-agents 命令)
  • 原生特性对齐:适配 OpenClaw 2026.2.15 的 session pruning、bootstrap size limits、cache retention 等新特性
  • 多提供商就绪:文档涵盖 OpenRouter、Together.ai、Google AI Studio 的降级策略,虽未内置自动切换但提供完整参考

局限性与风险

  • 手动集成为主:当前需手动调用 Python 脚本获取建议,尚未实现 OpenClaw 消息管道的自动钩取
  • Token Tracker 依赖手动记录:需与 session_status 工具集成才能自动追踪,目前需手动录入使用数据
  • 参考文件涉及外部服务PROVIDERS.mdconfig-patches.json 描述的多提供商策略需要外部 API 密钥和网络访问
  • 质量权衡:激进的 Haiku 路由可能在边缘场景牺牲输出质量,需根据业务场景调整 ROUTING_RULES
  • 缓存 TTL 对齐仅对 Anthropic 有效:其他提供商的缓存机制不同,55 分钟心跳策略可能不适用

适合人群

| 场景 | 预期收益 |
|------|---------|
| 个人高频使用(>10K 令牌/日) | 20-30% 成本削减 |
| 托管服务商(xCloud 等) | 40-60% 成本削减,支持客户级预算隔离 |
| 高并发企业部署 | 70-90% 成本削减,需配合多提供商策略 |
| API 限流/配额紧张场景 | 显著降低调用频率与令牌总量 |

常规风险

  • 预算超支:若未正确集成 token_tracker.py,可能在无预警情况下超出每日限额
  • 路由误判:自定义业务术语可能被误判为"简单任务"而路由至 Haiku,导致输出质量不足
  • 状态文件丢失:heartbeat_optimizer.py 和 token_tracker.py 依赖本地状态文件,目录权限问题会导致优化失效
  • 缓存策略误配:55 分钟心跳仅适配 1 小时 TTL,若配置为 2 小时 TTL 需重新计算间隔

安全解读

综合评估

OpenClaw Token Optimizer 是一套专为降低大模型 API 成本设计的本地化工具集,通过四大核心策略实现显著的成本优化。

核心用法

1. 上下文懒加载(最大收益):默认 OpenClaw 每次会话加载 50K+ token 的上下文文件,而该技能通过 context_optimizer.py 分析用户意图,仅加载必需文件(如简单问候只需 2 个文件,600 token),节省 80-93% 的上下文 token。

2. 智能模型路由model_router.py 自动识别任务复杂度,强制将问候、感谢等沟通类请求路由至最便宜的 Haiku 模型($0.25/MTok),避免浪费 Opus($15/MTok)。支持多提供商策略(OpenRouter、Together.ai、Google AI Studio 免费层)。

3. 心跳优化heartbeat_optimizer.py 将心跳间隔对齐 Anthropic 缓存 TTL(55 分钟),保持缓存温热以避免昂贵的缓存重写;同时支持智能间隔控制,夜间自动暂停,减少 50% 的无效 API 调用。

4. 预算追踪token_tracker.py 提供日预算监控、成本预警和模型降级建议,防止意外超支。

显著优点

  • 极致本地安全:4 个 Python 脚本 + 1 个 Bash wrapper 完全零网络请求、零第三方依赖、零子进程调用,仅使用 Python 标准库操作本地 JSON 状态文件
  • 量化收益明确:典型工作负载可降本 50-80%,激进优化(Gemini Flash + 懒加载)可达 90%
  • 原生特性整合:支持 OpenClaw 2026.2.15 新特性(会话剪枝、Bootstrap 大小限制、缓存保留策略)
  • 企业级安全认证:通过 Oracle 审计,静态分析 98 分,动态行为 96 分,零供应链风险

局限性与风险

  • 预算追踪需手动集成token_tracker.py 目前依赖手动记录,需与 OpenClaw 的 session_status 工具配合才能自动追踪
  • 多提供商策略需外部配置:PROVIDERS.md 中的替代服务商(OpenRouter 等)需用户自行申请 API Key 并配置网络访问
  • 路由规则需调优:默认的任务分类规则可能不匹配特定业务场景,需手动编辑 ROUTING_RULES

适合人群

  • 个人开发者:希望降低 Claude API 账单,预期节省 20-30%
  • 托管服务商(xCloud 等):管理多租户场景,通过强制 Haiku 默认 + Sonnet 交互 + Opus 复杂请求的分层策略,可节省 40-60%
  • 高吞吐量部署:结合多提供商 fallback 和本地 Ollama,实现 70-90% 成本削减

常规风险

  • 该技能本身无网络代码,但用户若启用多提供商策略,需自行评估外部 API 的隐私和安全政策
  • 过度激进的模型降级(如用 Haiku 处理复杂任务)可能影响输出质量,建议结合 A/B 测试
  • 状态文件存储于 ~/.openclaw/workspace/memory/,需确保该目录可写

关键洞察

> 上下文优化比模型路由更重要:将 50K 上下文降至 10K 的节省,超过将 Sonnet 换成 Haiku 的收益。优先实施懒加载!**

OpenClaw Token Optimizer 内容

scripts文件夹
手动下载zip · 33.0 kB
context_optimizer.pytext/plain
请选择文件