使用说明

核心能力与用法

Token Optimizer 是一套面向 OpenClaw 部署的综合成本优化工具，通过四大核心策略显著降低 LLM API 支出。

1. 上下文优化（最大收益）

默认 OpenClaw 每次会话加载 50K+ token 的完整上下文。本技能通过 context_optimizer.py 实现懒加载：根据用户提示复杂度智能选择必需文件。简单问候仅加载 2 个文件（SOUL.md + IDENTITY.md），节省 ~80% 上下文 token；标准任务选择性加载记忆文件，节省 ~50%；复杂任务才启用完整上下文。生成优化版 AGENTS.md.optimized 可进一步提升效率。

2. 智能模型路由

model_router.py 自动分类任务并路由至 appropriate 模型层级，强制规定：所有沟通类消息（问候、感谢、确认）必须使用 Haiku，绝不用 Sonnet/Opus；后台任务（日志解析、心跳检查、定时任务）同样强制 Haiku。复杂架构设计才建议 Opus。内置 ROUTING_RULES 和 COMMUNICATION_PATTERNS 可自定义。

3. 心跳优化

heartbeat_optimizer.py 通过追踪上次检查时间、强制最小间隔（邮件 60 分钟、日历 2 小时等）、尊重安静时段（23:00-08:00 跳过检查），实现 50% 的心跳 API 调用削减。返回 HEARTBEAT_OK 无活动时直接节省 token。

4. 预算追踪与多供应商策略

token_tracker.py 监控日预算消耗（ok/warning/exceeded 三级状态），高耗时操作前自动降级模型。PROVIDERS.md 提供 OpenRouter、Together.ai、Google AI Studio 等替代方案，Gemini 2.5 Flash 成本低至 $0.075/MTok，Google AI Studio 更可免费用于开发测试。

部署模式与收益

个人使用：优化心跳 + 手动路由，节省 20-30%
托管部署：默认 Haiku + 用户交互 Sonnet + 显式复杂请求才用 Opus，节省 40-60%
高流量场景：多供应商 fallback + 激进路由（80% Gemini），节省 70-90%

关键数据：10 万次 token/日工作负载，无优化时 $9/月，全套优化后 $2.70/月（70% 节省）；激进策略可降至 $0.90/月（90% 节省）。xCloud 100 客户场景月省 $315。

显著优点

安全设计：100% 本地文件分析，零网络请求、零代码执行、零子进程调用、零系统修改
即插即用：提供现成脚本和模板，无需 OpenClaw 核心改动即可生效
量化收益：每项优化均有明确成本测算，ROI 可追踪
灵活配置：路由规则、心跳间隔、预算阈值均可自定义
审计完备：安全认证报告完整，Morpheus 代码审计通过（2026-02-17）

局限性与风险

依赖手动集成：部分高级功能（prompt caching、自动懒加载）需 OpenClaw 核心支持，当前为待集成状态
预算追踪限制：token_tracker.py 需手动记录或等待 session_status 工具集成，无法自动实时解析
路由准确性：任务分类基于关键词匹配，边缘案例可能误判，需定期 review 调整规则
多供应商复杂度：fallback 链增加运维负担，API 密钥管理和健康监控需额外投入
质量权衡：过度激进的路由（如复杂任务误用 Haiku）可能影响输出质量，建议 A/B 测试验证

适合人群

高频率 OpenClaw 用户：日均数千次以上交互，成本敏感
多代理托管服务商：xCloud 等平台运营者，需规模化成本控制
企业合规场景：需预算上限和审计追踪的部署环境
开发者测试环境：利用 Gemini 免费额度降低实验成本

常规风险提示

模型降级可能导致任务失败或质量下降，关键业务建议保留人工审核
心跳间隔过长可能遗漏紧急事件，需根据业务 SLA 调整
第三方供应商 API 稳定性不一，生产环境建议保留 Anthropic 主供应商作为 fallback

安全解读

核心功能与价值

token-optimizer 是专为 OpenClaw 设计的全链路 Token 成本优化方案，通过六大模块协同实现费用削减：

1. 上下文懒加载（最大收益项）

默认 OpenClaw 每次会话加载 50K+ Token 的全量上下文（SOUL.md、AGENTS.md、docs/*/等）。本 Skill 的 context_optimizer.py 基于用户提示复杂度动态决策：简单问候仅加载 2 个文件（SOUL.md + IDENTITY.md），节省 80% 上下文 Token；标准任务选择性加载当日记忆；复杂架构分析才启用完整上下文。仅此一项即可实现 40-50% 成本降低。

2. 智能模型路由（Communication Pattern 强制降级）

model_router.py 新增通信模式识别：将 "hi"、"thanks"、"ok got it" 等 casual chat 强制路由至 Haiku（$0.25/MTok），彻底杜绝 Opus（$15/MTok）处理无意义对话的浪费。同时识别后台任务模式（日志解析、定时检查、CSV 处理），默认建议 Haiku。支持自定义 ROUTING_RULES 与 COMMUNICATION_PATTERNS。

3. 心跳调度优化

heartbeat_optimizer.py 替代固定轮询：为邮件、日历、天气、监控等检查类型配置独立最小间隔（默认 60 分钟至 4 小时），记录最后检查时间，静默时段（23:00-08:00）自动跳过，无任务时返回 HEARTBEAT_OK 避免无效 API 调用，减少 50% 心跳消耗。

4. Cronjob 模型强制规范

通过 cronjob-model-guide.md 建立标准：监控告警、数据解析、提醒类任务 90% 应使用 Haiku；仅内容生成、深度分析使用 Sonnet；Cronjob 永不使用 Opus。示例显示：10 个日频 Cronjob 从 Opus 切至 Haiku 每月节省 $17.70/Agent。

5. Token 预算追踪

token_tracker.py 提供每日用量监控、三级状态预警（ok/warning/exceeded）、超限时自动降级建议，支持多客户托管场景下的分账户预算隔离。

6. 多提供商策略

PROVIDERS.md 整合 OpenRouter（Gemini 2.5 Flash $0.075/MTok）、Together.ai（Llama 3.3 70B $0.18/MTok）、Google AI Studio（Gemini 2.0 Flash 免费）等替代方案，支持降级链路与批量操作成本优化。

显著优点

量化收益清晰：个人使用节省 20-30%，托管部署 40-60%，高并发场景 70-90%；100 客户 xCloud 场景月省 $315
零配置快速启动：generate-agents 一键生成优化 AGENTS.md，HEARTBEAT.template.md 即插即用
安全架构极致：S+ 认证，纯 Python 标准库（json/re/pathlib/datetime/os），零第三方依赖，无网络请求、无代码执行、无子进程、数据仅本地存储
渐进式采用：各模块可独立启用，不影响现有工作流

局限性与风险

核心功能待上游支持：Prompt Caching（Anthropic API 特性）、Lazy Context Loading、Multi-provider Fallback 需 OpenClaw 核心层适配，当前为「分析建议+部分工作区模板」模式，非全自动拦截
预算追踪依赖手动集成：token_tracker.py 需通过 session_status 工具获取真实用量，目前需手动记录或脚本封装
路由准确性需调优：默认规则覆盖常见场景，但垂直领域术语（如特定行业黑话）可能误判，需维护自定义规则
规模化运维复杂度：高并发场景的 A/B 测试、Provider 健康监控、实时成本预测等功能仍为「Future Enhancements」，需自建监控体系

适用人群

| 场景 | 预期节省 | 关键动作 |

|------|---------|---------|

| 个人高频使用（>50K tokens/日） | 20-30% | 安装 HEARTBEAT.md + 预算检查 |

| 托管服务商（xCloud 等） | 40-60% | 默认 Haiku + 用户请求路由 Sonnet |

| 高并发/多租户部署 | 70-90% | Gemini Flash 批量 + 激进路由 + Ollama 离线 |

| API 成本敏感型团队 | 50-80% | 上下文优化为核心 + 模型路由辅助 |

常规风险提示

1. 功能边界认知：本 Skill 为「优化顾问+辅助工具」而非系统级拦截器，实际生效需用户/工作流主动调用脚本或集成到 Agent 逻辑
2. 数据持久化依赖：状态文件存储于 ~/.openclaw/workspace/memory/，需确保目录可写，否则优化状态丢失
3. 版本兼容性：v1.3.0 基于 OpenClaw 当前架构设计，核心层 Lazy Loading 等特性落地后需跟进适配
4. 过度优化风险：极端激进的 Gemini 降级策略可能牺牲输出质量，建议保留 Sonnet 作为复杂任务 fallback

总结

token-optimizer 是当前 OpenClaw 生态中最完整、可审计性最高的成本优化方案，以 S+ 安全评级和纯本地架构消除部署顾虑，上下文懒加载与通信模式强制降级两大创新直击 OpenClaw 默认配置的最大浪费点。适合作为个人用户必备工具及托管服务商标准化基线，但需理解其「建议型」而非「拦截型」架构定位，配合上游功能演进逐步释放全部潜力。

cost-optimization api-management token-efficiency model-routing budget-tracking openclaw local-only no-network

OpenClaw Token Optimizer 内容

assets文件夹

references文件夹

scripts文件夹

手动下载zip · 28.4 kB

config-patches.jsonapplication/json

请选择文件