Name: Agent 工作空间的智能安全卫士
Author: AtlasPA

使用说明

核心用法

OpenClaw Warden Pro 是一款专为 Agent 工作空间设计的完整安全解决方案，在免费版检测能力基础上增加了自动化响应机制。用户通过 Python 脚本执行各类安全命令，核心工作流分为三个阶段：首先运行 baseline 建立文件哈希基线与快照，随后通过 verify、、scan、、full 等命令进行完整性验证与威胁检测，最后利用 Pro 版独有的 protect、、restore、、rollback、、quarantine` 等命令实现自动恢复与隔离。

推荐将 protect 命令集成到会话启动钩子（如 Claude Code 的 SessionStart）或 HEARTBEAT.md 心跳机制中，实现开机即防护的自动化安全策略。安装新 Skill 后立即执行 protect 可自动隔离异常修改工作空间的可疑组件。

显著优点

零依赖架构是最大亮点——仅使用 Python 标准库（hashlib、pathlib、shutil 等），无需 pip 安装，无网络调用，彻底杜绝供应链攻击面。跨平台兼容支持 OpenClaw、Claude Code、Cursor 等主流 Agent 工具链。检测维度全面，覆盖文件完整性（SHA-256）、提示词注入模式（指令覆盖、系统标记、HTML 注入）、Unicode 技巧（零宽字符、方向覆盖）三类威胁。响应机制完整，从快照恢复、Git 回滚到 Skill 隔离形成闭环，且所有操作均有明确用户确认或文档告知。

潜在缺点与局限性

protect 命令的自动化特性是把双刃剑——虽然提升了便利性，但自动恢复和隔离可能在特定场景下产生误操作（如用户有意修改配置文件后被自动还原）。无网络威胁情报，纯离线设计意味着无法获取最新的攻击特征库更新。Git 依赖限制，rollback 功能要求工作空间必须是 Git 仓库，纯本地项目无法使用。监控范围固定，仅覆盖 Critical、Memory、Config、Skills 四类文件，自定义目录需额外配置。无实时防护，基于命令触发的扫描机制而非文件系统事件监听，存在检测时间窗口。

适合的目标群体

AI 应用开发者：使用 Claude Code、Cursor 等工具构建 Agent 系统的工程师，需要保障工作空间完整性。安全敏感团队：金融、医疗、法律等对提示词注入和数据篡改风险高度警惕的组织。Skill 生态运营者：管理大量第三方 Skill 的平台或团队，需要批量安全审查与隔离能力。个人高级用户：对 AI 助手有深度定制需求，希望建立可审计、可回滚的安全基线。

使用风险

性能方面：首次 baseline 对大工作空间可能耗时较长；full 扫描涉及大量哈希计算，建议在非关键时段执行。依赖项风险：虽声明零依赖，但仍需 Python 3.8+ 运行时环境，系统 Python 版本不兼容将导致功能失效。误操作风险：restore 和 rollback 会覆盖现有文件，虽有验证机制但无法完全排除数据丢失；quarantine 重命名目录可能影响 Skill 间依赖关系。集成风险：自动钩子配置错误可能导致会话启动阻塞或循环触发。

安全解读

核心功能

OpenClaw Warden Pro 是专为 AI Agent 工作空间设计的完整安全层，提供从威胁检测到自动响应的全链路防护。核心能力分为两大板块：

检测能力（含免费版）

建立文件完整性基线快照，覆盖 SOUL.md 等关键配置文件
实时监控关键、记忆、配置、Skill 四类文件变更
内置提示词注入攻击模式检测（指令覆盖、系统提示标记等）
提供基线建立、验证、扫描、状态查询等完整 CLI

Pro 专属响应能力

restore: 从基线快照恢复被篡改文件
rollback: 从 Git 历史记录恢复文件
quarantine/unquarantine: 隔离/恢复可疑 Skill
protect: 一站式自动防护（扫描+自动恢复+自动隔离+问题标记）

显著优点

零攻击面: 纯 Python 标准库实现，无 pip 依赖，无网络调用，彻底杜绝供应链攻击
跨平台兼容: 支持 macOS/Linux/Windows，适配 OpenClaw、Claude Code、Cursor 等主流 Agent 工具
主动防御: protect 命令适合作为 Session 启动钩子，实现开箱即用的自动化防护
精准分级: 关键/配置类文件标记 WARNING，记忆类标记 INFO，避免告警疲劳

局限与风险

Git 依赖: 回滚功能依赖工作空间已初始化 Git 仓库
本地防护边界: 仅保护工作空间目录内文件，无法阻止 OS 级别的持久化攻击
检测规则时效性: 提示词注入模式需人工更新，无法自动适应新型攻击手法
误隔离风险: protect 自动隔离机制可能误判合法但修改了文件的 Skill

适合人群

高频使用 Claude Code / Cursor 等 Agent 工具的开发者
运行不可信第三方 Skill 的用户
对提示词注入攻击有防护需求的 AI 应用团队
追求最小依赖、可审计安全方案的技术洁癖者

安全等级说明

CLS-Certify 评分 82/A 级，T2 来源可信度（AtlasPA GitHub 组织）。子项表现优异：依赖审计 95 分、网络流量 90 分。唯一低分项为威胁情报（70 分），源于项目较新、社区验证时间有限。建议结合定期人工审计使用。

security automation devops development-engineering backend testing

openclaw-warden-pro 内容

scripts文件夹

手动下载zip · 12.7 kB

integrity.pytext/plain

请选择文件