ClawDefender - OpenClaw Security - Prompt injection, rogue skills etc

🛡️ AI Agent安全盾牌 · 实时威胁拦截

AI Agent专用安全防御工具,支持提示词注入、命令注入、SSRF等多维度威胁检测,扫描准确率78分,适合处理不可信外部输入。

收藏
22.7k
安装
8.8k
版本
1.0.1
CLS 安全性认证2026-05-04
点击查看完整报告 >

使用说明

核心用法

ClawDefender是一款专为AI Agent设计的防御性安全扫描工具,采用纯Bash脚本实现,无需复杂依赖。核心功能覆盖四大场景:

1. Skill安装审计 (--audit / --install): 扫描已安装技能或新安装技能,按CRITICAL/HIGH/WARNING三级风险评分输出
2. 输入消毒 (sanitize.sh): 管道化过滤外部输入(邮件、API响应、日历事件),支持--strict模式用于自动化流程中断

3. URL安全验证 (--check-url): 拦截SSRF攻击(169.254.169.254元数据端点)、私有IP、已知数据外泄服务(webhook.site)

4. 实时威胁检测 (--check-prompt / --validate): 90+正则模式识别提示词注入、命令注入、路径遍历

典型工作流curl 第三方API | ./sanitize.sh --json → 无标记则处理,有标记则阻断告警

显著优点

  • 零执行风险:仅使用grep/sed模式匹配,无eval/exec等危险操作,检测逻辑与执行逻辑完全隔离
  • 轻量部署:依赖bash/grep/sed/jq标准工具,无需Docker/编译环境
  • 防御覆盖全面:整合OWASP LLM Top 10研究,覆盖prompt injection、command injection、SSRF、credential exfiltration、path traversal五类攻击向量
  • CI/CD友好:退出码规范(0/1),支持--silent/--report等自动化模式,可嵌入技能安装钩子
  • 隐私合规:扫描日志本地存储($WORKSPACE/memory/),无敏感数据外发,通过GDPR数据最小化审计

潜在局限

  • 静态规则局限:基于正则的模式匹配难以应对对抗性绕过(如编码变形、分块注入),无法替代动态行为监控
  • 误报成本:安全文档类技能可能被误判为恶意(需手动维护排除列表)
  • T3来源风险:个人开发者维护,无顶级开源基金会背书,长期更新与应急响应能力不确定
  • 性能瓶颈:大输入无长度限制,超长文本可能导致grep处理延迟
  • 白名单粗放:ALLOWED_DOMAINS包含非必要域名(如wttr.in),最小权限原则执行不彻底

适合人群

  • AI Agent开发者:需为自研Agent添加输入过滤层
  • ClawHub重度用户:频繁安装第三方技能,需前置安全审计
  • 自动化工作流搭建者:通过HEARTBEAT.md规范团队安全操作习惯
  • 安全合规敏感场景:需满足基础数据本地化与GDPR要求的环境

常规风险

| 风险场景 | 说明 |
|---------|------|
| 规则绕过 | 攻击者使用base64编码、Unicode变体等规避正则检测 |
| 依赖工具漏洞 | jq/grep等基础工具若存在CVE可能影响检测链 |
| 日志膨胀 | security-scans.md无自动轮转,长期运行可能占用磁盘 |
| ClawHub供应链 | `--install`功能依赖npx clawhub,未验证软件包签名 |

建议:生产环境关键节点结合人工复核,定期审查T3来源更新动态,对高敏感场景补充动态沙箱检测。

安全解读

ClawDefender 综合评估

核心用法

ClawDefender 是一款专为 AI Agent 设计的防御性安全工具,采用纯 Bash 脚本实现,无需任何第三方依赖。主要功能模块包括:

1. 技能审计 (--audit):扫描已安装技能的安全风险,按严重程度分级(CRITICAL/HIGH/WARNING)
2. 输入净化 (sanitize.sh):管道式处理外部输入(邮件、API 响应、Trello 卡片等),检测提示注入攻击

3. URL 验证 (--check-url):防止 SSRF 攻击,拦截云元数据端点、私有网络、已知外泄服务

4. 提示检测 (--check-prompt):识别 90+ 种提示注入模式,包括指令覆盖、角色扮演、分隔符攻击

5. 命令注入检测:拦截危险 shell 模式、反弹 shell、fork bomb 等

6. 凭证窃取防护:保护 .env、SSH 密钥、API 密钥等敏感文件

显著优点

  • 零依赖架构:仅需 bashgrepsedjq,无供应链攻击风险
  • 被动防御设计:仅执行正则匹配检测,不修改系统状态,无网络通信
  • 自动化友好:提供 --strict 模式返回 exit code,可集成 CI/CD 流水线
  • 威胁分级明确:CRITICAL/HIGH/WARNING 三级评分系统,便于优先处理
  • CI 集成支持:可在构建流程中阻断含威胁的技能部署

潜在缺点与局限性

  • 正则匹配的局限:基于模式匹配而非语义分析,可能存在绕过(如编码混淆、同义词替换)
  • 误报风险:安全文档中的示例代码可能触发误报(如报告中的 rm -rf 示例)
  • T3 来源可信度:社区项目无可追溯 GitHub 仓库,缺乏知名维护者背书
  • 无动态行为分析:无法检测运行时的复杂攻击链或多步骤渗透
  • 性能瓶颈:大规模输入时的正则匹配效率未经验证

适合人群

  • 运行 ClawHub 技能生态系统的 AI Agent 用户
  • 需要处理不可信外部输入(邮件、Webhook、第三方 API)的自动化工作流
  • 安全意识强、具备基础脚本审查能力的开发者
  • 希望为 AI 工作流增加安全基线的团队

常规风险

  • 依赖工具自身的正确性:若 ClawDefender 本身存在检测逻辑缺陷,可能产生虚假安全感
  • 绕过攻击:高级攻击者可能使用编码、分块、语义变换等技术绕过静态检测
  • 配置遗漏:未集成到自动化流程时,人工操作可能跳过安全检查步骤
  • 版本维护:社区项目更新频率不确定,新攻击模式可能无法及时覆盖

使用建议

建议在沙箱环境验证检测效果后再投入生产,配合 HEARTBEAT.md 安全规范建立强制检查流程,并定期审计检测规则的覆盖率和准确率。

ClawDefender - OpenClaw Security - Prompt injection, rogue skills etc 内容

scripts文件夹
手动下载zip · 10.0 kB
clawdefender.shtext/x-shellscript
请选择文件