arc-shield

🛡️ Agent 响应敏感信息防护盾

基于正则与熵检测双层技术,实时扫描并阻断 Agent 响应中的 API 密钥、密码等敏感信息泄露,为 AI 输出提供轻量级隐私安全防护。

收藏
6.9k
安装
1.6k
版本
v1.0.0
CLS 安全性认证2026-05-17
点击查看完整报告 >

使用说明

arc-shield 是一款专为 AI Agent 设计的输出净化安全工具,通过实时扫描代理响应内容,防止 API 密钥、密码、私钥等敏感信息意外泄露到外部渠道(如 Discord、Signal、邮件等)。该工具采用 Bash 脚本与 Python 双版本实现,支持通过管道方式无缝集成到消息发送流程中。

核心用法方面,arc-shield 提供三种运行模式:默认模式(允许通过但输出警告)、严格模式(--strict,发现关键敏感信息时阻断并返回退出码 1)、脱敏模式(--redact,自动将检测到的敏感内容替换为 [REDACTED:TYPE])。用户可通过标准输入管道将 Agent 输出传入工具,经扫描后输出到标准输出,典型集成方式是在消息外发前添加预发送钩子(pre-send hook)。Python 版本额外提供基于香农熵(Shannon Entropy)的高熵字符串检测,可捕获未知格式的密钥。

显著优点包括:极致的轻量性,Bash 版本仅依赖系统标准命令(grep/sed),Python 版本仅使用标准库,无任何外部依赖;高性能表现,Bash 版本处理 1KB 文本仅需约 10ms,Python 版本约 50ms,适合高频率实时扫描;全面的检测能力,覆盖 1Password、GitHub、OpenAI、AWS 等主流平台的密钥格式,以及私钥、助记词、信用卡号、PII 等,同时通过熵分析捕获异常模式;灵活的配置机制,支持通过 config/patterns.conf 自定义正则规则和严重级别。

潜在缺点与局限性主要体现在:作为上下文无关的模式匹配工具,无法区分"这是我的密码:123"(泄露)与"请设置密码为:123"(指令)的语义差异;缺乏对话历史理解能力,无法检测跨消息的敏感信息引用;对于新型密钥格式依赖规则更新,存在滞后性;熵检测可能产生误报,高随机性正常文本可能被误判为密钥。

适合的目标群体主要包括:基于 OpenClaw 或其他 Agent 框架构建应用的开发者,需要将 Agent 输出发送到外部即时通讯平台(Discord、Telegram、Slack)或邮件系统的场景,处理包含敏感配置文件的运维自动化流程,以及对数据隐私合规有严格要求的企业级 AI 应用。

使用风险方面,首要风险是过度拦截(False Positives),严格模式可能因误报阻断正常业务消息,建议生产环境先以默认模式运行观察阈值;性能方面,虽然单次扫描很快,但超大文本(如完整日志文件)可能导致延迟,建议限制输入大小;此外,该工具仅作为"安全网"存在,不能替代 Agent 本身的安全训练与输入端验证(如 clawdefender),也不能防止刻意的恶意泄露。

安全解读

核心用法

arc-shield 是专为 AI Agent 设计的输出过滤器,在消息发往 Discord、Signal、X 等外部渠道前进行最后一道安全拦截。它通过管道方式集成到消息发送流程中:

# 严格模式:发现关键密钥即阻断
agent-output | arc-shield.sh --strict || echo "BLOCKED"

# 脱敏模式:将密钥替换为 [REDACTED:TYPE]
cat response.txt | arc-shield.sh --redact

Python 版本 output-guard.py 额外提供香农熵分析(阈值 4.5 bits),可捕获未知格式的高熵密钥。

显著优点

安全架构顶尖:零外部依赖(纯 Bash + Python 标准库)、纯本地执行(无网络/无文件写入)、CLS-Certify S 级认证(98/100 分)。

检测能力全面:覆盖 15+ 种密钥类型——1Password/Stripe/AWS 等 API 密钥、GitHub PAT、以太坊私钥、12/24 词钱包助记词、SSN/信用卡等 PII,以及高熵异常字符串。

性能优异:Bash 版本 <10ms、Python 版本 ~50ms,可实时嵌入每条消息发送流程。

集成友好:提供预发送钩子模板,与 OpenClaw Agent 生态无缝衔接。

潜在局限

语义理解缺失:无法区分「这是我的密码:X」(泄露)与「请设置密码为 X」(安全指令),依赖纯模式匹配。

模式更新负担:新型密钥格式需手动更新 config/patterns.conf,无法自动适应。

上下文隔离:单消息扫描,无法关联「密钥在上一条消息」等跨消息场景。

适合人群

  • 运营 AI Agent 并需外发消息至公共平台的开发者
  • 使用 1Password、加密钱包、云服务密钥的高安全意识团队
  • 需要满足 GDPR/CCPA 合规的数据敏感型企业

常规风险

  • 误报风险:高熵阈值可能将正常随机字符串标记为可疑
  • 漏报风险:未覆盖的新密钥格式或经过编码变形的密钥
  • 依赖单一防线:工具明确定位「安全网」而非「策略」,需配合 Agent 指令和提示工程使用

权威背书

来源可信度 T2(GitHub 组织账号),由 OpenClaw 维护,MIT 协议开源。安全报告 140+ 威胁模式零命中,供应链风险极低。

arc-shield 内容

examples文件夹
scripts文件夹
tests文件夹
手动下载zip · 28.5 kB
demo.shtext/x-shellscript
请选择文件