openclaw-sec

🛡️ AI Agent 实时安全防护专家

OpenClaw Security Team 出品的 AI Agent 实时安全防护套件,集成 6 大检测模块,20-50ms 内拦截提示注入、命令注入、SSRF 等攻击,保障 AI 系统安全运行。

收藏
1.2k
安装
513
版本
v0.2.6
CLS 安全性认证2026-05-17
点击查看完整报告 >

使用说明

核心用法

OpenClaw Security Suite 是一款专为 AI Agent 设计的综合性安全防护工具,通过 CLI 命令或自动钩子实现实时安全验证。核心工作流为:用户输入/工具调用 → 安全引擎并行调度 6 个检测模块 → 严重度评分 → 自动执行允许/警告/阻止操作。主要命令包括::validate-command 检测命令注入、、check-url 防范 SSRF、、validate-path 阻止目录遍历、、scan-content 扫描密钥泄露、、check-all 全模块综合扫描。支持通过 user-prompt-submit-hooktool-call-hook 实现透明化自动防护,无需修改业务代码即可嵌入现有 AI 工作流。

显著优点

全面威胁覆盖:6 个并行检测模块涵盖 168 种攻击模式,包括 92 种提示注入模式、24 种密钥检测模式、15 种路径遍历模式等,覆盖 OWASP LLM Top 10 主要风险。极致性能:并行架构设计确保 20-50ms 验证延迟,异步数据库写入不阻塞主流程,支持 1000+ 次验证/分钟吞吐量。灵活可配置:4 级灵敏度(paranoid/strict/medium/permissive)+ 模块级独立配置,支持白名单用户绕过、自定义动作映射、速率限制与信誉评分。生产就绪:内置 SQLite 持久化、结构化日志轮转、Webhook/Slack/Discord 通知、数据库自动优化,提供完整的可观测性体系。

潜在缺点与局限性

误报风险:严格模式下提示注入检测可能将合法的多轮对话上下文误判为攻击,需人工调优灵敏度。性能开销:secret_detector 模块依赖大量正则表达式,在 paranoid 模式下可能成为瓶颈,高并发场景建议关闭或降级。生态依赖:当前主要面向 Claude Code 生态,其他 AI Agent 框架需自行集成 CLI 或移植 TypeScript 核心库。数据隐私:安全事件默认持久化到本地 SQLite,敏感环境需配置加密存储或禁用数据库。版本管理:SKILL.md 与 package.json 版本号不一致(1.0.2 vs 0.4.0),反映发布流程待规范。

适合的目标群体

AI 应用开发者:构建面向公众的 LLM 应用,需防范提示注入、越狱攻击等。企业安全团队:为内部 AI 助手、RAG 系统、Agent 工作流添加合规审计层。DevOps/平台工程师:在 CI/CD 流水线中集成安全扫描,阻断含密钥泄露的代码提交。AI 服务运营商:多租户场景下通过用户信誉系统实现差异化风控策略。

使用风险

配置复杂性:灵敏度与动作映射的误配置可能导致过度阻断(影响用户体验)或防护不足(安全事件)。建议通过 openclaw-sec test 预设用例验证配置。数据库膨胀:默认 365 天数据保留,高流量场景需定期执行 db-vacuum 并调整 retention_days钩子冲突:自动钩子与现有 Claude Code 钩子可能存在执行顺序冲突,需检查 ~/.claude-code/hooks// 目录。正则 DoS:虽模式设计已优化,但极端构造的输入仍可能触发性能退化,建议配合超时机制使用。

安全解读

核心用法

OpenClaw Security Suite 是一款专为 AI Agent 系统设计的综合性安全验证工具,通过 /openclaw-sec 命令集提供实时防护。核心命令包括:

  • `check-all` - 全模块综合扫描,一键检测所有威胁类型
  • `validate-command` - 命令注入检测,拦截危险 shell 命令
  • `check-url` - SSRF 防护,阻止内网 IP、云元数据端点访问
  • `validate-path` - 路径遍历防护,识别 ../ 等攻击模式
  • `scan-content` - 密钥泄露扫描,检测 24 类 API 密钥和凭证

系统采用 6 个并行检测模块架构,内置 168 条检测规则,支持敏感度分级(paranoid/permissive 四档)和自动响应策略(allow/warn/block/block_notify)。

显著优点

性能优异:20-50ms 验证延迟,异步数据库写入不阻塞主流程,支持 1000+ 验证/分钟吞吐量
覆盖全面:涵盖提示词注入(92 种模式)、命令注入、SSRF、路径遍历、密钥泄露、内容混淆六大攻击面

生产就绪:支持用户信誉评分、速率限制、实时 Hook 自动防护、结构化日志审计

配置灵活:YAML 配置驱动,支持按模块独立调参,owner 白名单机制便于管理员运维

潜在局限

T3 来源风险:个人开发者(PaoloRollo)维护项目,无企业背书,需关注供应链安全
误报可能:严格模式下提示词注入检测可能将合法多轮对话误判为攻击

SQLite 瓶颈:高并发场景下单机数据库可能成为性能瓶颈

Node 生态依赖:基于 TypeScript/Node.js,对纯 Python 或其他语言栈环境集成成本较高

适合人群

  • AI 应用开发者:为 Claude、GPT 等 Agent 系统添加安全防护层
  • 企业安全团队:需要符合 GDPR 最小化原则、本地部署的安全审计工具
  • 平台运维人员:通过 Hook 机制实现透明化、零侵入的安全验证

常规风险

1. postinstall 脚本风险:npm 安装时自动执行 hook 安装脚本,建议 --ignore-scripts 后手动审查
2. 本地数据累积:安全事件数据库持续增长,需配置 retention_days 定期清理

3. hook 干扰业务:自动安装的输入验证 hook 可能影响特定交互流程,需充分测试

4. 模式绕过可能:编码混淆(base64、unicode)检测存在被高级攻击绕过的理论风险

openclaw-sec 内容

__tests__文件夹
integration文件夹
.github文件夹
workflows文件夹
hooks文件夹
legacy文件夹
security-input-validator文件夹
security-tool-validator文件夹
src文件夹
__tests__文件夹
benchmarks文件夹
core文件夹
__tests__文件夹
hooks文件夹
modules文件夹
code-execution-detector文件夹
__tests__文件夹
command-validator文件夹
__tests__文件夹
content-scanner文件夹
__tests__文件夹
exfiltration-detector文件夹
__tests__文件夹
injection-validator文件夹
__tests__文件夹
path-validator文件夹
__tests__文件夹
prompt-injection文件夹
__tests__文件夹
secret-detector文件夹
__tests__文件夹
serialization-detector文件夹
__tests__文件夹
url-validator文件夹
__tests__文件夹
patterns文件夹
obfuscation文件夹
prompt-injection文件夹
runtime-validation文件夹
secrets文件夹
types文件夹
tests文件夹
手动下载zip · 253.7 kB
end-to-end.test.tstext/plain
请选择文件