Openclaw Sec

🛡️ AI Agent 实时安全护盾 · 6模块并行防护

security榜 #25

AI Agent 实时安全套件,6模块并行检测提示注入、命令注入、SSRF等威胁,20-50ms极速响应

收藏
20.7k
安装
4.6k
版本
0.2.5
CLS 安全性认证2026-06-04
点击查看完整报告 >

使用说明

核心用法

OpenClaw Security Suite 是一款专为 AI Agent 设计的实时安全防护系统,通过 6 个并行检测模块(提示注入检测器、命令验证器、URL 验证器、路径验证器、密钥检测器、内容扫描器)提供全方位威胁防护。用户可通过 CLI 或 API 调用 /openclaw-sec 系列命令,如 validate-commandcheck-urlvalidate-pathscan-contentcheck-all 等进行单点或综合安全扫描。

系统采用智能严重度评分机制,根据检测结果自动执行允许、记录、警告、拦截或拦截+通知等分级响应。内置的 auto-hooks 机制可透明植入用户输入提交和工具调用环节,实现无感防护。配置层面支持 4 级敏感度(paranoid/strict/medium/permissive)和模块级独立调优,并提供完整的用户信誉评分、速率限制、事件分析等运营能力。

显著优点

  • 极速性能:20-50ms 验证延迟,异步数据库写入不阻塞主流程
  • 全面覆盖:168 种检测模式横跨 16 个类别,涵盖提示注入、SSRF、目录遍历、密钥泄露、编码混淆等主流攻击向量
  • 智能编排:并行模块执行 + 上下文感知严重度评分 + 自动化行动决策
  • 透明集成:auto-hooks 实现零代码改动嵌入 Claude 等 AI Agent 工作流
  • 运营可视:完整的 SQLite 数据库支持事件追踪、用户信誉、攻击模式分析

潜在局限

  • 误报风险:strict/paranoid 模式下提示注入检测可能过度敏感,影响正常交互体验
  • 性能开销:secret_detector 模块依赖重度正则匹配,高并发场景可能成为瓶颈
  • 本地化局限:当前仅支持 SQLite,大规模分布式部署需自行扩展存储后端
  • 维护依赖:168 条检测模式需持续更新以应对新型攻击变体

适合人群

  • 部署 Claude、AutoGPT 等 AI Agent 的生产环境运维团队
  • 金融、医疗、政务等对 AI 输出安全性要求极高的合规场景
  • 需要满足 SOC2、ISO27001 等审计要求的 AI 产品团队
  • 个人开发者构建涉及文件操作、网络请求、代码执行的 AI 应用

常规风险

| 风险类型 | 说明 | 缓解建议 |
|---------|------|---------|
| 配置误用 | permissive 敏感度可能漏过精心构造的攻击 | 生产环境至少使用 medium |
| 密钥硬编码 | `.openclaw-sec.yaml` 中 owner_ids 等敏感配置泄露 | 使用环境变量注入,禁止提交至版本控制 |
| 数据库未加密 | `.openclaw-sec.db` 默认无加密,事件日志包含用户输入片段 | 限制文件权限 600,敏感场景启用磁盘加密 |
| 依赖供应链 | TypeScript/Node.js 依赖树存在被投毒风险 | 锁定版本,启用 SLSA/Sigstore 验证 |

安全解读

综合评估

OpenClaw Security Suite 是一款专为 AI Agent 设计的实时安全防护工具,提供 6 个并行的检测模块,涵盖提示注入、命令注入、SSRF、路径遍历、密钥泄露和内容策略违规等核心安全威胁。

核心用法

该 skill 通过 CLI 命令和自动钩子两种方式提供保护:

  • CLI 验证validate-commandcheck-urlvalidate-pathscan-contentcheck-all 等命令支持对各类输入进行独立或综合安全扫描
  • 自动钩子user-prompt-submit-hooktool-call-hook 可在用户无感知的情况下拦截风险输入
  • 配置驱动:通过 .openclaw-sec.yaml 灵活调整敏感度级别(paranoid/strict/medium/permissive)和模块开关

显著优点

1. 全面覆盖:168 个检测模式跨越 16 个类别,92 个提示注入专项模式
2. 性能优异:并行模块设计,20-50ms 验证延迟,异步数据库写入不阻塞主流程

3. 智能分级:上下文感知的风险评分,支持 allow/warn/block/block_notify 四级响应

4. 生态友好:TypeScript 编写,670+ 测试用例,依赖精简(仅 3 个生产依赖),无已知 CVE

5. 可观测性强:内置事件追踪、用户信誉评分、统计分析等功能

潜在局限

1. T3 来源:个人开发者维护,非知名组织背书,长期维护稳定性存疑
2. 误报可能:严格的检测规则在复杂场景下可能产生误报,需调优敏感度

3. 本地存储:SQLite 本地数据库在分布式部署场景下存在数据同步挑战

4. 通知依赖:Webhook/Slack/Discord 通知需用户自行配置,无内置高可用机制

适合人群

  • 部署 Claude Code 或其他 AI Agent 的开发团队
  • 需要满足基础安全合规要求的中小企业
  • 对延迟敏感但安全预算有限的生产环境

常规风险

  • 元数据收集:默认收集 userId、sessionId 用于信誉评分,需关注数据保留策略(默认 365 天)
  • 权限绕过:owner_ids 配置可完全绕过检测,需严格管控管理员名单
  • 外部通知:启用 webhook 时需确保 HTTPS 传输和密钥轮换
  • 文件系统:数据库和日志文件路径需配置适当的访问控制

部署建议

建议生产环境采用 strict 敏感度,启用全部 6 个模块,配置 30-90 天数据保留期,并定期执行 db-vacuum 维护。关键场景下建议结合人工审计,而非完全依赖自动化拦截。

Openclaw Sec 内容

__tests__文件夹
integration文件夹
.github文件夹
workflows文件夹
hooks文件夹
legacy文件夹
security-input-validator文件夹
security-tool-validator文件夹
src文件夹
__tests__文件夹
benchmarks文件夹
core文件夹
__tests__文件夹
hooks文件夹
modules文件夹
command-validator文件夹
__tests__文件夹
content-scanner文件夹
__tests__文件夹
path-validator文件夹
__tests__文件夹
prompt-injection文件夹
__tests__文件夹
secret-detector文件夹
__tests__文件夹
url-validator文件夹
__tests__文件夹
patterns文件夹
obfuscation文件夹
prompt-injection文件夹
runtime-validation文件夹
secrets文件夹
types文件夹
tests文件夹
手动下载zip · 234.6 kB
end-to-end.test.tstext/plain
请选择文件