Token Saver

🪙 模型感知的 AI 成本优化专家

Token Saver v3 是一款模型感知的 OpenClaw AI 成本优化工具,支持 24+ 主流模型的动态上下文压缩与智能文件优化,可在不损失语义的前提下显著降低 API 调用成本。

收藏
26.7k
安装
5.5k
版本
3.0.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心功能

Token Saver v3 通过模型感知架构实现智能成本优化,核心能力包括:

动态压缩预设:根据当前模型的上下文窗口(128K-2M 不等)自动调整压缩策略,提供 Aggressive(40%)、Balanced(60%)、Conservative(80%)、Off(95%) 四档预设,确保 Claude 200K 与 Gemini 1M 获得差异化处理。

分层文件压缩:针对工作区文件采用差异化策略——SOUL.md 轻量压缩保留人格语言,AGENTS.md 中压密集化指令,USER.md/MEMORY.md 重度压缩为键值格式,PROJECTS.md 完全跳过保护用户结构。

鲁棒模型检测:五级回退链(运行时注入→环境变量→配置文件→文件推断→安全默认),内置 24+ 模型注册表,未知模型自动降级至 200K 安全上下文并告警。

安全机制:自动备份(.backup)、智能绕过已优化文件、一键回滚(/optimize revert),全程本地运算零外部调用。

显著优点

  • 真·模型感知:非固定阈值,百分比动态适配让大上下文模型(Gemini 2M)充分发挥优势
  • 零语义损失:Integrity > Size 原则,拒绝为压缩牺牲可读性
  • 渐进式优化:Persistent Mode 通过 AGENTS.md 注入写作规范,从源头控制 Token 增长
  • 生态兼容:覆盖 Claude、GPT-4o/o 系列、Gemini、DeepSeek、Kimi 等主流模型

局限与风险

  • 非通用方案:仅针对 OpenClaw 工作流设计,对标准 OpenAI API 直接调用无感知
  • 模型版本敏感:严格匹配(opus-6.5≠opus-4.5),新模型需手动更新 models.json
  • 压缩不可逆性:重度压缩后的 USER.md/MEMORY.md 可读性下降,需依赖备份还原
  • 上下文幻觉风险:过度压缩可能导致长对话中的细微偏好丢失

适合人群

高频使用 Claude/GPT-4o/Gemini 等高单价模型的开发者、需长期维护大型项目上下文的 AI 原生工作流用户、对 API 成本敏感且愿意接受轻度可读性折损的生产环境。

常规风险

安全等级 A:无外部网络调用,文件操作受限工作区内,备份机制完善。主要风险为误操作压缩导致关键注释丢失,建议首次使用前执行 /optimize 预览而非直接应用预设。

安全解读

Token Saver v3 综合评估

Token Saver v3 是一款面向 AI Agent 用户和开发者的本地化 Token 优化工具,其核心价值在于通过压缩工作区文件(如 SOUL.md、USER.md 等)和动态管理聊天上下文窗口,切实减少每次 API 调用的 Token 消耗,从而直接降低使用 Claude、GPT-4、Gemini 等大型语言模型的经济成本。

核心用法:该技能围绕“模型感知”理念构建,内置了涵盖 24 种以上主流模型的注册表,能自动检测当前使用的模型及其上下文窗口大小。用户可通过 /optimize 指令调用仪表板,直观查看 Token 使用占比;利用 /optimize tokens 命令智能压缩工作区 Markdown 文件(针对 SOUL、AGENTS、USER 等不同文件类型采用不同的无损压缩策略);使用 /optimize compaction 命令根据预设的激进、平衡、保守等比例,动态设置聊天历史的压缩阈值。所有操作均在本地完成,无需访问外部网络。

显著优点:首先,成本优化效果直接,通过文件压缩和上下文压缩双管齐下,有效减少了 API 消费。其次,安全性设计考虑周全,所有修改操作自动创建 .backup 备份,并支持随时通过 /optimize revert 一键恢复,确保了数据的完整性和可逆性。第三,模型检测机制鲁棒性高,采用多层备用链路,即使检测失败也能回退到安全默认值。第四,技术上追求极简,零外部依赖(仅使用 Node.js 内置模块),无任何网络请求行为,彻底消除了供应链攻击和数据外泄的风险敞口。

潜在缺点与局限性:该技能最值得注意的缺陷在于其预置压缩模板的实现方式。安全审计发现,部分文件特定的压缩方法(compressMemory 等)实际上会忽略用户文件的原始内容,直接返回硬编码的模板字符串。尽管有备份保护,但这在行为上更接近于“内容替换”而非“智能压缩”,对未经验证的存量内容存在数据覆盖风险。此外,代码中嵌入了开发者个人的手机号、邮箱、Telegram 账号等隐私信息,若触发上述模板替换,这些 PII 将被写入用户文件中,构成不良的隐私实践。作为个人开发者维护的 T3 级项目,其长期维护和兼容性更新的可靠性也需用户自行承担。

适合的目标群体:最适合那些重度使用 Claude、GPT-4o、Gemini 等商业 API,且对成本敏感的开发者、独立创作者和小型团队。对于已经建立了结构化管理的工作区文件并频繁进行长对话的用户,能立竿见影地看到费用下降。同时,该工具也很适合那些对数据隐私和本地化处理有严格要求,但又能接受开源社区项目固有风险的技术用户。

使用风险提示:主要风险源于预置模板的内容替换机制。建议用户在任何批量压缩操作前,务必备份重要文件,并首先在小范围文件上测试 /optimize revert 的恢复功能。其次,需要注意开发者 PII 可能意外污染工作区文件的风险。常规性风险如性能影响很小,因为工具完全在本地运行且逻辑轻量。依赖性风险极低,但需要确保 Node.js 环境的兼容性。整体而言,这是一款设计思路优秀且安全性基础扎实的效率工具,只需关注少数实现层面的已知问题,即可安全地发挥其节约成本的巨大价值。

Token Saver 内容

scripts文件夹
手动下载zip · 29.6 kB
analyzer.jstext/javascript
请选择文件