OpenClaw Token Optimizer

💰 AI成本削减70%,安全零风险

dev-tools榜 #15

OpenClaw成本优化工具集,通过智能模型路由、上下文懒加载、心跳优化和多供应商策略,实现50-90%的API成本削减,100%本地文件分析无安全风险。

收藏
38.1k
安装
9.9k
版本
1.3.1
CLS 安全性认证2026-05-17
点击查看完整报告 >

使用说明

核心能力与用法

Token Optimizer 是一套面向 OpenClaw 部署的综合成本优化工具,通过四大核心策略显著降低 LLM API 支出。

1. 上下文优化(最大收益)

默认 OpenClaw 每次会话加载 50K+ token 的完整上下文。本技能通过 context_optimizer.py 实现懒加载:根据用户提示复杂度智能选择必需文件。简单问候仅加载 2 个文件(SOUL.md + IDENTITY.md),节省 ~80% 上下文 token;标准任务选择性加载记忆文件,节省 ~50%;复杂任务才启用完整上下文。生成优化版 AGENTS.md.optimized 可进一步提升效率。

2. 智能模型路由

model_router.py 自动分类任务并路由至 appropriate 模型层级,强制规定:所有沟通类消息(问候、感谢、确认)必须使用 Haiku,绝不用 Sonnet/Opus;后台任务(日志解析、心跳检查、定时任务)同样强制 Haiku。复杂架构设计才建议 Opus。内置 ROUTING_RULESCOMMUNICATION_PATTERNS 可自定义。

3. 心跳优化

heartbeat_optimizer.py 通过追踪上次检查时间、强制最小间隔(邮件 60 分钟、日历 2 小时等)、尊重安静时段(23:00-08:00 跳过检查),实现 50% 的心跳 API 调用削减。返回 HEARTBEAT_OK 无活动时直接节省 token。

4. 预算追踪与多供应商策略

token_tracker.py 监控日预算消耗(ok/warning/exceeded 三级状态),高耗时操作前自动降级模型。PROVIDERS.md 提供 OpenRouter、Together.ai、Google AI Studio 等替代方案,Gemini 2.5 Flash 成本低至 $0.075/MTok,Google AI Studio 更可免费用于开发测试。

部署模式与收益

  • 个人使用:优化心跳 + 手动路由,节省 20-30%
  • 托管部署:默认 Haiku + 用户交互 Sonnet + 显式复杂请求才用 Opus,节省 40-60%
  • 高流量场景:多供应商 fallback + 激进路由(80% Gemini),节省 70-90%

关键数据:10 万次 token/日工作负载,无优化时 $9/月,全套优化后 $2.70/月(70% 节省);激进策略可降至 $0.90/月(90% 节省)。xCloud 100 客户场景月省 $315。

显著优点

  • 安全设计:100% 本地文件分析,零网络请求、零代码执行、零子进程调用、零系统修改
  • 即插即用:提供现成脚本和模板,无需 OpenClaw 核心改动即可生效
  • 量化收益:每项优化均有明确成本测算,ROI 可追踪
  • 灵活配置:路由规则、心跳间隔、预算阈值均可自定义
  • 审计完备:安全认证报告完整,Morpheus 代码审计通过(2026-02-17)

局限性与风险

  • 依赖手动集成:部分高级功能(prompt caching、自动懒加载)需 OpenClaw 核心支持,当前为待集成状态
  • 预算追踪限制token_tracker.py 需手动记录或等待 session_status 工具集成,无法自动实时解析
  • 路由准确性:任务分类基于关键词匹配,边缘案例可能误判,需定期 review 调整规则
  • 多供应商复杂度:fallback 链增加运维负担,API 密钥管理和健康监控需额外投入
  • 质量权衡:过度激进的路由(如复杂任务误用 Haiku)可能影响输出质量,建议 A/B 测试验证

适合人群

  • 高频率 OpenClaw 用户:日均数千次以上交互,成本敏感
  • 多代理托管服务商:xCloud 等平台运营者,需规模化成本控制
  • 企业合规场景:需预算上限和审计追踪的部署环境
  • 开发者测试环境:利用 Gemini 免费额度降低实验成本

常规风险提示

  • 模型降级可能导致任务失败或质量下降,关键业务建议保留人工审核
  • 心跳间隔过长可能遗漏紧急事件,需根据业务 SLA 调整
  • 第三方供应商 API 稳定性不一,生产环境建议保留 Anthropic 主供应商作为 fallback

安全解读

核心功能与价值

token-optimizer 是专为 OpenClaw 设计的全链路 Token 成本优化方案,通过六大模块协同实现费用削减:

1. 上下文懒加载(最大收益项)

默认 OpenClaw 每次会话加载 50K+ Token 的全量上下文(SOUL.md、AGENTS.md、docs/*/等)。本 Skill 的 context_optimizer.py 基于用户提示复杂度动态决策:简单问候仅加载 2 个文件(SOUL.md + IDENTITY.md),节省 80% 上下文 Token;标准任务选择性加载当日记忆;复杂架构分析才启用完整上下文。仅此一项即可实现 40-50% 成本降低。

2. 智能模型路由(Communication Pattern 强制降级)

model_router.py 新增通信模式识别:将 "hi"、"thanks"、"ok got it" 等 casual chat 强制路由至 Haiku($0.25/MTok),彻底杜绝 Opus($15/MTok)处理无意义对话的浪费。同时识别后台任务模式(日志解析、定时检查、CSV 处理),默认建议 Haiku。支持自定义 ROUTING_RULESCOMMUNICATION_PATTERNS

3. 心跳调度优化

heartbeat_optimizer.py 替代固定轮询:为邮件、日历、天气、监控等检查类型配置独立最小间隔(默认 60 分钟至 4 小时),记录最后检查时间,静默时段(23:00-08:00)自动跳过,无任务时返回 HEARTBEAT_OK 避免无效 API 调用,减少 50% 心跳消耗。

4. Cronjob 模型强制规范

通过 cronjob-model-guide.md 建立标准:监控告警、数据解析、提醒类任务 90% 应使用 Haiku;仅内容生成、深度分析使用 Sonnet;Cronjob 永不使用 Opus。示例显示:10 个日频 Cronjob 从 Opus 切至 Haiku 每月节省 $17.70/Agent。

5. Token 预算追踪

token_tracker.py 提供每日用量监控、三级状态预警(ok/warning/exceeded)、超限时自动降级建议,支持多客户托管场景下的分账户预算隔离。

6. 多提供商策略

PROVIDERS.md 整合 OpenRouter(Gemini 2.5 Flash $0.075/MTok)、Together.ai(Llama 3.3 70B $0.18/MTok)、Google AI Studio(Gemini 2.0 Flash 免费)等替代方案,支持降级链路与批量操作成本优化。

显著优点

  • 量化收益清晰:个人使用节省 20-30%,托管部署 40-60%,高并发场景 70-90%;100 客户 xCloud 场景月省 $315
  • 零配置快速启动generate-agents 一键生成优化 AGENTS.md,HEARTBEAT.template.md 即插即用
  • 安全架构极致:S+ 认证,纯 Python 标准库(json/re/pathlib/datetime/os),零第三方依赖,无网络请求、无代码执行、无子进程、数据仅本地存储
  • 渐进式采用:各模块可独立启用,不影响现有工作流

局限性与风险

  • 核心功能待上游支持:Prompt Caching(Anthropic API 特性)、Lazy Context Loading、Multi-provider Fallback 需 OpenClaw 核心层适配,当前为「分析建议+部分工作区模板」模式,非全自动拦截
  • 预算追踪依赖手动集成token_tracker.py 需通过 session_status 工具获取真实用量,目前需手动记录或脚本封装
  • 路由准确性需调优:默认规则覆盖常见场景,但垂直领域术语(如特定行业黑话)可能误判,需维护自定义规则
  • 规模化运维复杂度:高并发场景的 A/B 测试、Provider 健康监控、实时成本预测等功能仍为「Future Enhancements」,需自建监控体系

适用人群

| 场景 | 预期节省 | 关键动作 |
|------|---------|---------|
| 个人高频使用(>50K tokens/日) | 20-30% | 安装 HEARTBEAT.md + 预算检查 |
| 托管服务商(xCloud 等) | 40-60% | 默认 Haiku + 用户请求路由 Sonnet |
| 高并发/多租户部署 | 70-90% | Gemini Flash 批量 + 激进路由 + Ollama 离线 |
| API 成本敏感型团队 | 50-80% | 上下文优化为核心 + 模型路由辅助 |

常规风险提示

1. 功能边界认知:本 Skill 为「优化顾问+辅助工具」而非系统级拦截器,实际生效需用户/工作流主动调用脚本或集成到 Agent 逻辑
2. 数据持久化依赖:状态文件存储于 ~/.openclaw/workspace/memory/,需确保目录可写,否则优化状态丢失

3. 版本兼容性:v1.3.0 基于 OpenClaw 当前架构设计,核心层 Lazy Loading 等特性落地后需跟进适配

4. 过度优化风险:极端激进的 Gemini 降级策略可能牺牲输出质量,建议保留 Sonnet 作为复杂任务 fallback

总结

token-optimizer 是当前 OpenClaw 生态中最完整、可审计性最高的成本优化方案,以 S+ 安全评级和纯本地架构消除部署顾虑,上下文懒加载与通信模式强制降级两大创新直击 OpenClaw 默认配置的最大浪费点。适合作为个人用户必备工具及托管服务商标准化基线,但需理解其「建议型」而非「拦截型」架构定位,配合上游功能演进逐步释放全部潜力。

OpenClaw Token Optimizer 内容

assets文件夹
references文件夹
scripts文件夹
手动下载zip · 28.4 kB
config-patches.jsonapplication/json
请选择文件