agent-self-governance

🛡️ 智能代理自治与风险防护框架

基于WAL等数据库可靠性协议的AI自我治理框架,防止上下文丢失、虚假完成等失败模式,确保代理行为一致且成本可控。

收藏
11.8k
安装
2.9k
版本
v1.1.0
CLS 安全性认证2026-05-10
点击查看完整报告 >

使用说明

Agent Self-Governance 是一套专为自主AI代理设计的自我治理与风险防护框架,通过五大核心协议解决AI在长期运行中的常见失效模式。该技能基于数据库级别的可靠性理念构建,完全依赖Python标准库实现,确保零外部依赖和完全的本地数据主权。

核心用法涵盖五个互补协议:WAL(Write-Ahead Log)要求代理在响应前先写入关键记忆,支持会话恢复和上下文持久化;VBR(Verify Before Reporting)强制在声明任务完成前执行实际验证命令,消除幻觉导致的虚假完成;ADL(Anti-Divergence Limit)监控并防止代理人格漂移,检测过度谄媚或被动行为;VFM(Value-For-Money)追踪token消耗与任务价值的比率,防止预算浪费;IKL(Infrastructure Knowledge Logging)确保基础设施发现立即持久化,防止"我会记住"的反模式。

显著优点在于其架构的简洁性与安全性。所有数据存储于本地~/clawd/memory/目录,无网络传输风险;纯标准库实现消除了供应链攻击面;WAL的预写机制确保关键决策在响应前已持久化,有效防止上下文截断导致的失忆;VBR的验证闭环消除了AI幻觉导致的虚假完成声明;ADL通过量化评分机制主动维护人格一致性。

潜在缺点主要源于其T3来源属性与功能边界。作为个人开发者作品,缺乏企业级维护背书;VBR协议虽设30秒超时,但仍使用shell=True执行外部命令,需严格管控输入源;纯本地存储设计虽保障隐私,却阻碍了多设备状态同步;JSON日志缺乏损坏容错机制,异常文件可能导致读取失败。

适合目标群体包括构建长期运行AI代理的开发者、需要高可靠性自动化工作流的运维团队、以及关注AI成本效益的极客用户。特别适用于对话窗口有限但需保持长期上下文、或需要严格行为一致性的专业场景。

使用风险方面,需警惕VBR验证命令的注入风险,务必确保传入命令来自可信源;本地存储依赖用户自行备份,磁盘损坏将导致历史记录永久丢失;ADL的漂移检测依赖规则匹配,可能产生误判;此外,该框架缺乏分布式锁机制,不适合多并发代理同时写入同一WAL文件的场景。

安全解读

核心用法

Agent Self-Governance 是一套为自主AI代理设计的自我治理协议集合,包含五个互补的模块:WAL(写前日志)、VBR(报告前验证)、ADL(防偏离限制)、VFM(性价比追踪)和 IKL(基础设施知识日志)。

WAL(Write-Ahead Log) 确保关键信息在响应前先持久化,支持用户修正记录、关键决策日志、会话恢复和预压缩内存刷新。通过 appendbuffer-addflush-bufferreplay 命令实现可靠的上下文管理。

VBR(Verify Before Reporting) 强制"验证后才声称完成"的原则,通过 check 命令验证文件存在性、文件修改时间、命令执行状态和Git推送状态,防止虚假完成声明。

ADL(Anti-Divergence Limit) 监控代理行为与既定人格(SOUL.md)的偏离程度,追踪谄媚、被动、犹豫和冗长等反模式,计算偏离分数并触发再校准。

VFM(Value-For-Money) 实现成本效益追踪,按任务类型推荐模型层级(Budget/Standard/Premium),记录令牌消耗和成本,生成优化建议。

IKL(Infrastructure Knowledge Logging) 强制在发现硬件规格、服务配置、网络拓扑等基础设施信息时立即记录,避免"我会记住"的反模式。

显著优点

  • 系统性风险防控:覆盖代理失效的五大根因——上下文丢失、虚假完成、人格漂移、资源浪费、基础设施遗忘
  • 零外部依赖:仅使用Python标准库,供应链攻击面极小
  • 模块化设计:五个协议可独立启用,按需组合
  • 审计友好:所有操作生成JSONL格式日志,便于后续分析
  • 会话恢复能力:WAL replay机制有效应对内存压缩导致的上下文丢失

潜在缺点与局限性

  • shell=True风险:VBR模块使用subprocess.run(..., shell=True),虽限制为预定义检查类型,仍存在命令注入理论风险(CVSS 4.3)
  • T3来源可信度:来自个人开发者GitHub账号,长期维护能力和信誉背书相对较弱
  • 明文存储:治理数据以JSONL明文存储,敏感信息(成本、行为模式)缺乏加密保护
  • 输入验证不足:agent_id、task_id等参数缺乏严格的格式验证,存在路径遍历风险
  • 无访问审计:缺少敏感操作(文件写入、命令执行)的审计日志

适合人群

  • 运行长期自动化任务的AI代理系统
  • 需要高可靠性、可审计性的企业级Agent部署
  • 多会话、易因内存压缩丢失上下文的场景
  • 关注成本控制的多层级模型调度场景
  • 基础设施动态变化频繁的DevOps自动化场景

常规风险

  • 命令注入:VBR的shell=True若被绕过类型限制可能引发安全问题
  • 数据泄露:明文存储的治理日志若权限配置不当可能被其他用户读取
  • 来源风险:个人开发者维护的代码需额外审查更新频率和社区反馈
  • 磁盘耗尽:日志自动清理机制不完善可能导致空间占用无限增长
  • 误报/漏报:ADL的行为模式分析可能产生不准确的偏离判断

agent-self-governance 内容

scripts文件夹
手动下载zip · 12.8 kB
adl.pytext/plain
请选择文件