Name: AI Agent 实时安全防护专家
Author: PaoloRollo

使用说明

核心用法

OpenClaw Security Suite 是一款专为 AI Agent 设计的综合性安全防护工具，通过 CLI 命令或自动钩子实现实时安全验证。核心工作流为：用户输入/工具调用 → 安全引擎并行调度 6 个检测模块 → 严重度评分 → 自动执行允许/警告/阻止操作。主要命令包括：：validate-command 检测命令注入、、check-url 防范 SSRF、、validate-path 阻止目录遍历、、scan-content 扫描密钥泄露、、check-all 全模块综合扫描。支持通过 user-prompt-submit-hook 和 tool-call-hook 实现透明化自动防护，无需修改业务代码即可嵌入现有 AI 工作流。

显著优点

全面威胁覆盖：6 个并行检测模块涵盖 168 种攻击模式，包括 92 种提示注入模式、24 种密钥检测模式、15 种路径遍历模式等，覆盖 OWASP LLM Top 10 主要风险。极致性能：并行架构设计确保 20-50ms 验证延迟，异步数据库写入不阻塞主流程，支持 1000+ 次验证/分钟吞吐量。灵活可配置：4 级灵敏度（paranoid/strict/medium/permissive）+ 模块级独立配置，支持白名单用户绕过、自定义动作映射、速率限制与信誉评分。生产就绪：内置 SQLite 持久化、结构化日志轮转、Webhook/Slack/Discord 通知、数据库自动优化，提供完整的可观测性体系。

潜在缺点与局限性

误报风险：严格模式下提示注入检测可能将合法的多轮对话上下文误判为攻击，需人工调优灵敏度。性能开销：secret_detector 模块依赖大量正则表达式，在 paranoid 模式下可能成为瓶颈，高并发场景建议关闭或降级。生态依赖：当前主要面向 Claude Code 生态，其他 AI Agent 框架需自行集成 CLI 或移植 TypeScript 核心库。数据隐私：安全事件默认持久化到本地 SQLite，敏感环境需配置加密存储或禁用数据库。版本管理：SKILL.md 与 package.json 版本号不一致（1.0.2 vs 0.4.0），反映发布流程待规范。

适合的目标群体

AI 应用开发者：构建面向公众的 LLM 应用，需防范提示注入、越狱攻击等。企业安全团队：为内部 AI 助手、RAG 系统、Agent 工作流添加合规审计层。DevOps/平台工程师：在 CI/CD 流水线中集成安全扫描，阻断含密钥泄露的代码提交。AI 服务运营商：多租户场景下通过用户信誉系统实现差异化风控策略。

使用风险

配置复杂性：灵敏度与动作映射的误配置可能导致过度阻断（影响用户体验）或防护不足（安全事件）。建议通过 openclaw-sec test 预设用例验证配置。数据库膨胀：默认 365 天数据保留，高流量场景需定期执行 db-vacuum 并调整 retention_days。钩子冲突：自动钩子与现有 Claude Code 钩子可能存在执行顺序冲突，需检查 ~/.claude-code/hooks// 目录。正则 DoS：虽模式设计已优化，但极端构造的输入仍可能触发性能退化，建议配合超时机制使用。

安全解读

核心用法

OpenClaw Security Suite 是一款专为 AI Agent 系统设计的综合性安全验证工具，通过 /openclaw-sec 命令集提供实时防护。核心命令包括：

`check-all` - 全模块综合扫描，一键检测所有威胁类型
`validate-command` - 命令注入检测，拦截危险 shell 命令
`check-url` - SSRF 防护，阻止内网 IP、云元数据端点访问
`validate-path` - 路径遍历防护，识别 ../ 等攻击模式
`scan-content` - 密钥泄露扫描，检测 24 类 API 密钥和凭证

系统采用 6 个并行检测模块架构，内置 168 条检测规则，支持敏感度分级（paranoid/permissive 四档）和自动响应策略（allow/warn/block/block_notify）。

显著优点

性能优异：20-50ms 验证延迟，异步数据库写入不阻塞主流程，支持 1000+ 验证/分钟吞吐量
覆盖全面：涵盖提示词注入（92 种模式）、命令注入、SSRF、路径遍历、密钥泄露、内容混淆六大攻击面
生产就绪：支持用户信誉评分、速率限制、实时 Hook 自动防护、结构化日志审计
配置灵活：YAML 配置驱动，支持按模块独立调参，owner 白名单机制便于管理员运维

潜在局限

T3 来源风险：个人开发者（PaoloRollo）维护项目，无企业背书，需关注供应链安全
误报可能：严格模式下提示词注入检测可能将合法多轮对话误判为攻击
SQLite 瓶颈：高并发场景下单机数据库可能成为性能瓶颈
Node 生态依赖：基于 TypeScript/Node.js，对纯 Python 或其他语言栈环境集成成本较高

适合人群

AI 应用开发者：为 Claude、GPT 等 Agent 系统添加安全防护层
企业安全团队：需要符合 GDPR 最小化原则、本地部署的安全审计工具
平台运维人员：通过 Hook 机制实现透明化、零侵入的安全验证

常规风险

1. postinstall 脚本风险：npm 安装时自动执行 hook 安装脚本，建议 --ignore-scripts 后手动审查
2. 本地数据累积：安全事件数据库持续增长，需配置 retention_days 定期清理
3. hook 干扰业务：自动安装的输入验证 hook 可能影响特定交互流程，需充分测试
4. 模式绕过可能：编码混淆（base64、unicode）检测存在被高级攻击绕过的理论风险

security ai-safety backend devops automation testing

openclaw-sec 内容

__tests__文件夹

integration文件夹

.github文件夹

workflows文件夹

hooks文件夹

legacy文件夹

security-input-validator文件夹

security-tool-validator文件夹

src文件夹

__tests__文件夹

benchmarks文件夹

core文件夹

__tests__文件夹

hooks文件夹

modules文件夹

code-execution-detector文件夹

__tests__文件夹

command-validator文件夹

__tests__文件夹

content-scanner文件夹

__tests__文件夹

exfiltration-detector文件夹

__tests__文件夹

injection-validator文件夹

__tests__文件夹

path-validator文件夹

__tests__文件夹

prompt-injection文件夹

__tests__文件夹

secret-detector文件夹

__tests__文件夹

serialization-detector文件夹

__tests__文件夹

url-validator文件夹

__tests__文件夹

patterns文件夹

obfuscation文件夹

prompt-injection文件夹

runtime-validation文件夹

secrets文件夹

types文件夹

tests文件夹

手动下载zip · 253.7 kB

end-to-end.test.tstext/plain

请选择文件