openclaw-warden-pro

🛡️ Agent 工作空间的智能安全卫士

AtlasPA 出品的 Agent 工作空间安全套件,提供文件完整性监控、提示词注入检测与自动响应能力,零依赖纯本地运行,为 AI 开发环境构建可信防护层。

收藏
6.3k
安装
2.2k
版本
v1.0.1
CLS 安全性认证2026-05-09
点击查看完整报告 >

使用说明

核心用法

OpenClaw Warden Pro 是一款专为 Agent 工作空间设计的完整安全解决方案,在免费版检测能力基础上增加了自动化响应机制。用户通过 Python 脚本执行各类安全命令,核心工作流分为三个阶段:首先运行 baseline 建立文件哈希基线与快照,随后通过 verifyscanfull 等命令进行完整性验证与威胁检测,最后利用 Pro 版独有的 protectrestorerollbackquarantine` 等命令实现自动恢复与隔离。

推荐将 protect 命令集成到会话启动钩子(如 Claude Code 的 SessionStart)或 HEARTBEAT.md 心跳机制中,实现开机即防护的自动化安全策略。安装新 Skill 后立即执行 protect 可自动隔离异常修改工作空间的可疑组件。

显著优点

零依赖架构是最大亮点——仅使用 Python 标准库(hashlib、pathlib、shutil 等),无需 pip 安装,无网络调用,彻底杜绝供应链攻击面。跨平台兼容支持 OpenClaw、Claude Code、Cursor 等主流 Agent 工具链。检测维度全面,覆盖文件完整性(SHA-256)、提示词注入模式(指令覆盖、系统标记、HTML 注入)、Unicode 技巧(零宽字符、方向覆盖)三类威胁。响应机制完整,从快照恢复、Git 回滚到 Skill 隔离形成闭环,且所有操作均有明确用户确认或文档告知。

潜在缺点与局限性

protect 命令的自动化特性是把双刃剑——虽然提升了便利性,但自动恢复和隔离可能在特定场景下产生误操作(如用户有意修改配置文件后被自动还原)。无网络威胁情报,纯离线设计意味着无法获取最新的攻击特征库更新。Git 依赖限制rollback 功能要求工作空间必须是 Git 仓库,纯本地项目无法使用。监控范围固定,仅覆盖 Critical、Memory、Config、Skills 四类文件,自定义目录需额外配置。无实时防护,基于命令触发的扫描机制而非文件系统事件监听,存在检测时间窗口。

适合的目标群体

AI 应用开发者:使用 Claude Code、Cursor 等工具构建 Agent 系统的工程师,需要保障工作空间完整性。安全敏感团队:金融、医疗、法律等对提示词注入和数据篡改风险高度警惕的组织。Skill 生态运营者:管理大量第三方 Skill 的平台或团队,需要批量安全审查与隔离能力。个人高级用户:对 AI 助手有深度定制需求,希望建立可审计、可回滚的安全基线。

使用风险

性能方面:首次 baseline 对大工作空间可能耗时较长;full 扫描涉及大量哈希计算,建议在非关键时段执行。依赖项风险:虽声明零依赖,但仍需 Python 3.8+ 运行时环境,系统 Python 版本不兼容将导致功能失效。误操作风险restorerollback 会覆盖现有文件,虽有验证机制但无法完全排除数据丢失;quarantine 重命名目录可能影响 Skill 间依赖关系。集成风险:自动钩子配置错误可能导致会话启动阻塞或循环触发。

安全解读

核心功能

OpenClaw Warden Pro 是专为 AI Agent 工作空间设计的完整安全层,提供从威胁检测到自动响应的全链路防护。核心能力分为两大板块:

检测能力(含免费版)

  • 建立文件完整性基线快照,覆盖 SOUL.md 等关键配置文件
  • 实时监控关键、记忆、配置、Skill 四类文件变更
  • 内置提示词注入攻击模式检测(指令覆盖、系统提示标记等)
  • 提供基线建立、验证、扫描、状态查询等完整 CLI

Pro 专属响应能力

  • restore: 从基线快照恢复被篡改文件
  • rollback: 从 Git 历史记录恢复文件
  • quarantine/unquarantine: 隔离/恢复可疑 Skill
  • protect: 一站式自动防护(扫描+自动恢复+自动隔离+问题标记)

显著优点

  • 零攻击面: 纯 Python 标准库实现,无 pip 依赖,无网络调用,彻底杜绝供应链攻击
  • 跨平台兼容: 支持 macOS/Linux/Windows,适配 OpenClaw、Claude Code、Cursor 等主流 Agent 工具
  • 主动防御: protect 命令适合作为 Session 启动钩子,实现开箱即用的自动化防护
  • 精准分级: 关键/配置类文件标记 WARNING,记忆类标记 INFO,避免告警疲劳

局限与风险

  • Git 依赖: 回滚功能依赖工作空间已初始化 Git 仓库
  • 本地防护边界: 仅保护工作空间目录内文件,无法阻止 OS 级别的持久化攻击
  • 检测规则时效性: 提示词注入模式需人工更新,无法自动适应新型攻击手法
  • 误隔离风险: protect 自动隔离机制可能误判合法但修改了文件的 Skill

适合人群

  • 高频使用 Claude Code / Cursor 等 Agent 工具的开发者
  • 运行不可信第三方 Skill 的用户
  • 对提示词注入攻击有防护需求的 AI 应用团队
  • 追求最小依赖、可审计安全方案的技术洁癖者

安全等级说明

CLS-Certify 评分 82/A 级,T2 来源可信度(AtlasPA GitHub 组织)。子项表现优异:依赖审计 95 分、网络流量 90 分。唯一低分项为威胁情报(70 分),源于项目较新、社区验证时间有限。建议结合定期人工审计使用。

openclaw-warden-pro 内容

scripts文件夹
手动下载zip · 12.7 kB
integrity.pytext/plain
请选择文件