OpenClaw Token Optimizer

💰 智能路由降本 70%,上下文精准加载

devops榜 #8

OpenClaw 成本优化工具包,通过智能模型路由、上下文懒加载、心跳优化和预算追踪,实现 50-90% 的 API 费用削减,100% 本地安全运行。

收藏
43.5k
安装
9.9k
版本
1.3.0
CLS 安全性认证2026-05-16
点击查看完整报告 >

使用说明

核心功能

Token Optimizer 是一套完整的 OpenClaw 部署成本优化方案,针对 LLM API 调用中的四大烧钱场景提供自动化解决方案。

上下文懒加载(最大收益):通过 context_optimizer.py 分析用户提示复杂度,智能决定加载哪些文件。简单问候仅需 2 个文件(SOUL.md + IDENTITY.md),而非默认的 50+ 个文件,直接削减 80% 的上下文 token。

智能模型路由model_router.py 自动分类任务并路由到合适模型层级。关键创新是「通信模式强制」—— 所有问候语、感谢、确认等社交用语强制使用 Haiku($0.25/MTok),杜绝用 Opus($15/MTok)回复 "hi" 的浪费。

心跳优化heartbeat_optimizer.py 替代固定间隔轮询,按需执行检查(邮件 60 分钟、日历 2 小时、天气 4 小时),并支持安静时段跳过,减少 50% 的心跳 API 调用。

预算追踪token_tracker.py 实时监控每日支出,在达到 80% 阈值时预警,超限时强制降级到最便宜模型。

多供应商策略:内置 OpenRouter、Together.ai、Google AI Studio 的 cost-per-MTok 对比表,支持 Gemini 2.5 Flash($0.075/MTok)等超低价替代方案。

显著优点

  • 量化收益明确:个人用户 20-30% 节省,托管部署 40-60%,大批量场景 70-90%
  • 零配置快速启动:5 条 bash 命令即可运行,无需修改 OpenClaw 核心
  • 安全边界清晰:纯本地文件分析,无网络请求、无代码执行、无系统修改
  • 集成友好:所有脚本返回 JSON,易于嵌入现有工作流

局限性与风险

  • 需要手动集成:自动路由需等待 OpenClaw 核心支持,当前为建议模式而非强制执行
  • 预算追踪依赖手动记录token_tracker.py 需要与 session_status 工具集成才能自动获取用量
  • 上下文优化需 AGENTS.md 替换:生成优化版本后需人工审核替换,非一键生效
  • 供应商策略需 API 密钥管理:多供应商 fallback 需要额外的密钥配置和故障转移逻辑

适合人群

  • xCloud 等托管服务商:100 客户场景下月省 $315,ROI 极高
  • 高频 OpenClaw 用户:日用量 100K+ tokens 时优化效果最明显
  • 多 agent 部署者:心跳优化和 cronjob 模型选择在规模化场景下收益倍增

安全评估

经 Morpheus (Code Reviewer) 审计,2026-02-17 验证:无网络、无执行、无子进程、纯本地数据,安全等级 S+。

安全解读

Token Optimizer:OpenClaw 成本优化利器

核心定位:专为降低 OpenClaw AI Agent 部署成本而设计的综合工具集,通过四层优化策略实现显著的 Token 开销削减。

核心能力与用法

1. 上下文懒加载(Context Optimization)——最大节省项

  • 默认 OpenClaw 每次会话加载 50K+ Token(SOUL.md、AGENTS.md、docs/** 等全部文件)
  • 本工具根据用户输入智能推荐所需文件:简单问候仅需 2 个文件(~80% 节省),标准任务约 50% 节省
  • 使用 context_optimizer.py recommend "<prompt>" 获取加载建议,或生成优化版 AGENTS.md

2. 智能模型路由(Smart Model Routing)

  • 自动识别任务复杂度并推荐模型层级:Haiku(简单/沟通类)、Sonnet(中等)、Opus(复杂推理)
  • 关键特性:强制拦截「hi」「thanks」等沟通类查询,永不浪费 Opus/Sonnet Token
  • 集成方式:调用 model_router.py "<user prompt>" 获取路由建议

3. 心跳调度优化(Heartbeat Optimization)

  • 智能追踪各类检查(邮件、日历、监控)的最后执行时间
  • 强制执行最小间隔(默认邮件 60 分钟、监控 30 分钟),支持静默时段跳过
  • 预期减少 50% 心跳 API 调用

4. Token 预算追踪与 Cronjob 优化

  • 实时监控日度消耗,超限时自动降级至便宜模型
  • 提供 Cronjob 模型选择指南:90% 定时任务应使用 Haiku,避免 Opus 处理简单监控

显著优点

  • 成本效益突出:典型工作负载节省 50-80%,高吞吐量场景可达 70-90%
  • 零配置快速启动:复制模板、运行脚本即可生效,无需修改核心配置
  • 多层优化叠加:上下文优化 + 模型路由组合效果优于单一策略
  • 完全离线安全:所有脚本仅用 Python 标准库,无网络请求、无代码执行、无子进程

局限性与注意事项

  • 部分功能待核心支持:Prompt 缓存、完整的多 Provider 自动回退需 OpenClaw 核心更新
  • 预算追踪需手动集成:需结合 OpenClaw 的 session_status 工具实现全自动追踪
  • 路由规则需调优:默认模式可能不完全匹配特定业务场景,建议自定义 ROUTING_RULES
  • 状态文件管理:需确保 ~/.openclaw/workspace/memory/ 目录可写,建议定期清理旧状态

适用人群

  • 个人用户:希望降低自用 Agent 的 API 账单(预期节省 20-30%)
  • 托管服务商(如 xCloud):管理多租户 Agent 部署,实现客户级预算控制(节省 40-60%)
  • 企业高吞吐量场景:日均百万 Token 级部署,需多 Provider 策略与激进成本优化(节省 70-90%)

常规风险与缓解

| 风险场景 | 缓解措施 |
|---------|---------|
| 过度激进路由导致质量下降 | 保留手动 Opus 覆盖选项,定期审查路由准确性 |
| 状态文件丢失导致预算追踪中断 | 定期备份 `~/.openclaw/workspace/memory/*.json` |
| 上下文加载不足影响任务完成 | 复杂任务自动降级为「完整上下文」模式,用户可强制加载 |
| 多 Provider 配置错误 | 参考 `PROVIDERS.md` 渐进式启用,先测试后生产 |

部署建议

推荐渐进式实施:先启用上下文优化(最大收益),再叠加模型路由,最后根据规模启用心跳优化和多 Provider 策略。定期使用 token_tracker.py check 监控实际节省效果,按需调整阈值。

OpenClaw Token Optimizer 内容

assets文件夹
references文件夹
scripts文件夹
手动下载zip · 28.4 kB
config-patches.jsonapplication/json
请选择文件