token-saver

💰 AI成本智能优化专家

开源社区维护的AI成本优化工具,通过智能压缩工作区文件和动态上下文管理,帮助OpenClaw用户显著降低API调用成本。

收藏
8.8k
安装
2.6k
版本
v3.0.0
CLS 安全性认证2026-05-20
点击查看完整报告 >

使用说明

核心用法

Token Saver v3 是一款专为 OpenClaw AI 平台设计的成本优化工具,通过三条核心路径帮助用户降低 API 费用:

1. 工作区文件压缩:自动扫描并压缩 SOUL.md、USER.md、MEMORY.md、AGENTS.md 等核心文件,采用差异化策略——SOUL.md 轻度压缩保留人格语言,AGENTS.md 中度压缩优化指令密度,USER.md/MEMORY.md 重度压缩为键值格式,PROJECTS.md 则完全跳过以保护用户结构。

2. 模型感知动态压缩:内置 24+ 主流模型的上下文窗口注册表(Claude/GPT/Gemini/DeepSeek 等),根据当前模型自动调整压缩阈值。提供 Aggressive(40%)、Balanced(60%)、Conservative(80%)、Off(95%) 四档预设,例如 Gemini 1M 上下文下 Balanced 阈值为 600K tokens。

3. 持久化写作指导:向 AGENTS.md 注入写作规范,引导 AI 在不同文件中采用最优表达风格,从源头控制 token 增长。

用户通过 /optimize 系列命令操作:完整仪表盘查看上下文使用率、、/optimize tokens 执行压缩、、/optimize compaction 管理聊天压缩阈值、、/optimize revert 一键回滚。

显著优点

  • 模型原生适配:告别固定阈值,动态百分比适配从 64K 到 2M 的各种上下文窗口
  • 智能防重复:已优化文件自动跳过,避免无效处理
  • 零外部依赖:纯本地分析,无网络请求,隐私安全
  • 多重回滚保障:自动 .backup 文件 + revert 命令双重保险
  • 透明可追溯:所有文件操作、模型检测逻辑完全开源可审计

潜在局限

  • 平台锁定:专为 OpenClaw 生态设计,SOUL.md/AGENTS.md 等文件命名具有平台特异性
  • 压缩不可逆性:语义压缩会损失部分表达丰富性,虽声明"完整性优先"但极端压缩下仍有风格改变
  • 模型检测盲区:严格版本匹配策略下,新模型或别名可能无法识别,回退至保守的 200K 默认值
  • 提示注入隐患:压缩后的 MEMORY.md 采用类系统消息格式,存在潜在注入风险(已披露)

适合人群

  • 高频 OpenClaw 用户:日均数十次以上 API 调用,上下文文件累积导致成本激增
  • 多模型切换用户:经常在 Claude/GPT/Gemini 间迁移,需要自动适配不同上下文策略
  • 长上下文项目:处理代码库、知识库等需要大上下文窗口的场景
  • 成本敏感团队:有明确预算控制需求的开发团队或研究机构

使用风险

  • 文件修改风险:虽自动备份,但首次使用建议手动 Git 提交或额外备份
  • 版本兼容:v3 动态预设与 v2 固定阈值行为差异大,升级后需重新评估压缩策略
  • 持久化污染:AGENTS.md 注入的指导语可能与其他技能冲突,需监控 AI 行为变化
  • 性能开销:大工作区的首次扫描可能产生短暂延迟,建议非高峰时段执行

安全解读

Token Saver v3:AI上下文成本优化利器

Token Saver v3 是一款专为AI编程助手用户设计的本地token优化工具,核心目标是通过智能压缩工作区文件来降低OpenClaw、Claude等平台的API调用成本。

核心用法

该工具采用/optimize命令体系,提供四层核心功能:

1. 全局仪表盘/optimize):展示当前检测到的AI模型、上下文窗口大小及实时使用率百分比,以可视化进度条呈现。

2. 文件压缩引擎/optimize tokens):智能扫描SOUL.md、AGENTS.md、USER.md、MEMORY.md等工作区文件,根据文件类型采用差异化压缩策略——SOUL.md保留人格化语言轻压缩,AGENTS.md采用高密度指令格式,USER/MEMORY.md转为key:value极简格式,PROJECTS.md则完全保留用户结构。

3. 动态上下文管理/optimize compaction):突破性的模型感知设计,根据检测到的模型上下文窗口(如Claude 200K、Gemini 1M、GPT-4o 128K)动态计算压缩阈值,提供Aggressive(40%)、Balanced(60%)、Conservative(80%)三级预设,支持自定义数值阈值。

4. 持久化写作模式:向AGENTS.md注入写作风格指南,使后续对话自动保持token高效格式。

显著优点

  • 成本直接削减:每次API调用都传输完整工作区上下文,压缩后可显著减少token消耗,长期使用节省真金白银
  • 零依赖架构:仅使用Node.js内置模块(fs/path/os),3个文件约1200行代码,无供应链攻击风险
  • 模型生态全覆盖:内置24+模型注册表,涵盖Claude 3.5-4.6、GPT-4o-5.2、Gemini 1M-2M、DeepSeek、Kimi等主流模型
  • 防御性设计:自动.backup备份、智能跳过已优化文件、语义完整性优先于压缩率、/optimize revert一键回滚
  • 鲁棒检测链:五层模型检测机制(运行时注入→环境变量→配置文件→文件推断→安全默认),即使配置缺失也能安全降级

潜在局限与风险

  • 持久化副作用:修改AGENTS.md可能影响AI代理行为模式,虽可恢复但需用户理解机制
  • 压缩语义损失:高密度压缩虽保留核心含义,但可能牺牲表达丰富性,需人工审核首次效果
  • 路径遍历行为:安装于skills目录时会向上遍历两级定位workspace,虽有限制但仍属非标准操作
  • 配置信息读取:访问~/.openclaw/openclaw.json获取模型配置,用户需确认不含敏感凭证
  • 作者可信度:T3级个人开发者(RubenAQuispe),无企业背书,长期维护依赖社区

适合人群

  • 高频使用AI编程助手且承担API费用的开发者
  • 工作区文件庞大、上下文窗口紧张的重度用户
  • 使用Claude/GPT/Gemini多模型切换的跨平台用户
  • 追求精细化成本控制的团队与个人

常规风险提示

该工具仅操作本地文件,无网络外泄风险,但修改核心配置文件(.md)前建议手动备份关键数据。首次使用建议在非生产环境测试压缩效果,确认语义完整性后再全面部署。

token-saver 内容

scripts文件夹
手动下载zip · 29.2 kB
analyzer.jstext/javascript
请选择文件