skills/asif2bd/OpenClaw Token Optimizer

OpenClaw Token Optimizer

💰 智能路由降本 70%，上下文精准加载

devops榜 #8

OpenClaw 成本优化工具包，通过智能模型路由、上下文懒加载、心跳优化和预算追踪，实现 50-90% 的 API 费用削减，100% 本地安全运行。

收藏

43.5k

安装

9.9k

版本

1.3.0

CLS 安全性认证2026-05-16

点击查看完整报告 >

使用说明

核心功能

Token Optimizer 是一套完整的 OpenClaw 部署成本优化方案，针对 LLM API 调用中的四大烧钱场景提供自动化解决方案。

上下文懒加载（最大收益）：通过 context_optimizer.py 分析用户提示复杂度，智能决定加载哪些文件。简单问候仅需 2 个文件（SOUL.md + IDENTITY.md），而非默认的 50+ 个文件，直接削减 80% 的上下文 token。

智能模型路由：model_router.py 自动分类任务并路由到合适模型层级。关键创新是「通信模式强制」—— 所有问候语、感谢、确认等社交用语强制使用 Haiku（$0.25/MTok），杜绝用 Opus（$15/MTok）回复 "hi" 的浪费。

心跳优化：heartbeat_optimizer.py 替代固定间隔轮询，按需执行检查（邮件 60 分钟、日历 2 小时、天气 4 小时），并支持安静时段跳过，减少 50% 的心跳 API 调用。

预算追踪：token_tracker.py 实时监控每日支出，在达到 80% 阈值时预警，超限时强制降级到最便宜模型。

多供应商策略：内置 OpenRouter、Together.ai、Google AI Studio 的 cost-per-MTok 对比表，支持 Gemini 2.5 Flash（$0.075/MTok）等超低价替代方案。

显著优点

量化收益明确：个人用户 20-30% 节省，托管部署 40-60%，大批量场景 70-90%
零配置快速启动：5 条 bash 命令即可运行，无需修改 OpenClaw 核心
安全边界清晰：纯本地文件分析，无网络请求、无代码执行、无系统修改
集成友好：所有脚本返回 JSON，易于嵌入现有工作流

局限性与风险

需要手动集成：自动路由需等待 OpenClaw 核心支持，当前为建议模式而非强制执行
预算追踪依赖手动记录：token_tracker.py 需要与 session_status 工具集成才能自动获取用量
上下文优化需 AGENTS.md 替换：生成优化版本后需人工审核替换，非一键生效
供应商策略需 API 密钥管理：多供应商 fallback 需要额外的密钥配置和故障转移逻辑

适合人群

xCloud 等托管服务商：100 客户场景下月省 $315，ROI 极高
高频 OpenClaw 用户：日用量 100K+ tokens 时优化效果最明显
多 agent 部署者：心跳优化和 cronjob 模型选择在规模化场景下收益倍增

安全评估

经 Morpheus (Code Reviewer) 审计，2026-02-17 验证：无网络、无执行、无子进程、纯本地数据，安全等级 S+。

安全解读

Token Optimizer：OpenClaw 成本优化利器

核心定位：专为降低 OpenClaw AI Agent 部署成本而设计的综合工具集，通过四层优化策略实现显著的 Token 开销削减。

核心能力与用法

1. 上下文懒加载（Context Optimization）——最大节省项

默认 OpenClaw 每次会话加载 50K+ Token（SOUL.md、AGENTS.md、docs/** 等全部文件）
本工具根据用户输入智能推荐所需文件：简单问候仅需 2 个文件（~80% 节省），标准任务约 50% 节省
使用 context_optimizer.py recommend "<prompt>" 获取加载建议，或生成优化版 AGENTS.md

2. 智能模型路由（Smart Model Routing）

自动识别任务复杂度并推荐模型层级：Haiku（简单/沟通类）、Sonnet（中等）、Opus（复杂推理）
关键特性：强制拦截「hi」「thanks」等沟通类查询，永不浪费 Opus/Sonnet Token
集成方式：调用 model_router.py "<user prompt>" 获取路由建议

3. 心跳调度优化（Heartbeat Optimization）

智能追踪各类检查（邮件、日历、监控）的最后执行时间
强制执行最小间隔（默认邮件 60 分钟、监控 30 分钟），支持静默时段跳过
预期减少 50% 心跳 API 调用

4. Token 预算追踪与 Cronjob 优化

实时监控日度消耗，超限时自动降级至便宜模型
提供 Cronjob 模型选择指南：90% 定时任务应使用 Haiku，避免 Opus 处理简单监控

显著优点

成本效益突出：典型工作负载节省 50-80%，高吞吐量场景可达 70-90%
零配置快速启动：复制模板、运行脚本即可生效，无需修改核心配置
多层优化叠加：上下文优化 + 模型路由组合效果优于单一策略
完全离线安全：所有脚本仅用 Python 标准库，无网络请求、无代码执行、无子进程

局限性与注意事项

部分功能待核心支持：Prompt 缓存、完整的多 Provider 自动回退需 OpenClaw 核心更新
预算追踪需手动集成：需结合 OpenClaw 的 session_status 工具实现全自动追踪
路由规则需调优：默认模式可能不完全匹配特定业务场景，建议自定义 ROUTING_RULES
状态文件管理：需确保 ~/.openclaw/workspace/memory/ 目录可写，建议定期清理旧状态

适用人群

个人用户：希望降低自用 Agent 的 API 账单（预期节省 20-30%）
托管服务商（如 xCloud）：管理多租户 Agent 部署，实现客户级预算控制（节省 40-60%）
企业高吞吐量场景：日均百万 Token 级部署，需多 Provider 策略与激进成本优化（节省 70-90%）

常规风险与缓解

| 风险场景 | 缓解措施 |

|---------|---------|

| 过度激进路由导致质量下降 | 保留手动 Opus 覆盖选项，定期审查路由准确性 |

| 状态文件丢失导致预算追踪中断 | 定期备份 `~/.openclaw/workspace/memory/*.json` |

| 上下文加载不足影响任务完成 | 复杂任务自动降级为「完整上下文」模式，用户可强制加载 |

| 多 Provider 配置错误 | 参考 `PROVIDERS.md` 渐进式启用，先测试后生产 |

部署建议

推荐渐进式实施：先启用上下文优化（最大收益），再叠加模型路由，最后根据规模启用心跳优化和多 Provider 策略。定期使用 token_tracker.py check 监控实际节省效果，按需调整阈值。

cost-optimization token-management model-routing api-costs openclaw budget-tracking multi-provider heartbeat-optimization

OpenClaw Token Optimizer 内容

assets文件夹

references文件夹

scripts文件夹

手动下载zip · 28.4 kB

config-patches.jsonapplication/json

请选择文件