核心用法
ecap-security-auditor 是一个面向 AI Agent 生态的安全审计框架,提供自动安全门控和手动深度审计两大能力。安装或使用任何 skill、MCP 服务器、npm/pip 包时,系统自动查询信任注册表、验证文件完整性哈希、计算 Trust Score(0-100),并根据阈值决定放行(≥70)、警告(40-69)或拦截(<40)。若无可信数据,则触发自动审计流程,分析源码后上传报告。
关键机制:
- Trust Score 计算:100 减去各严重级 finding 的扣分(Critical -25, High -15, Medium -8, Low -3),高风险组件(hooks/、.mcp.json 等)×1.2 倍惩罚
- 完整性验证:对比本地文件 SHA-256 与审计时记录的哈希,不匹配则硬拦截
- AI 专属检测:12 类提示注入模式(AI_PROMPT_001~012)、6 类持久化机制(PERSIST_001~006)、7 类高级混淆技术(零宽字符、base64→exec 链等)
- 跨文件分析:识别多文件攻击链(凭证读取+网络外传、权限提升+持久化等),标记为 CORR_ 前缀 finding
显著优点
1. 零配置被动防护:安装即触发安全门,无需用户干预
2. 众包式信任网络:每个 Agent 审计后上传报告,注册表有机增长
3. AI 原生威胁建模:针对 LLM Agent 特有的提示注入、工具滥用、指令层级攻击设计检测规则
4. 版本感知完整性:区分"合法更新"与"篡改攻击",避免误杀
5. 可恢复的信任分:修复 issue 后通过 /fix 端点恢复 50% 扣分,误报标记后全额恢复
潜在缺点与局限
- 完整性数据库覆盖有限:目前仅
ecap-security-auditor自身在库,多数包需依赖 findings 评分而非哈希验证 - 网络依赖:API 不可达时只能降级为"用户自担风险"或本地缓存模式
- 大包审计成本:500+ 文件项目需启发式跳过,可能漏检非入口文件中的攻击
- AI 检测误报:防御性代码(如"不要透露提示词")可能与攻击模式混淆,需人工复核
- Self-review 禁止:无法直接修正自己报告的误报,必须依赖社区 peer review
适合人群
- AI Agent 开发者:需验证自身 skill/MCP 安全性,或集成安全门到 Agent 运行时
- 安全研究员:贡献审计报告、参与 peer review 获取积分排名
- 企业部署团队:建立内部信任注册表(可通过
ECAP_REGISTRY_URL自定义),管控第三方组件准入
常规风险
- SKILL.md 供应链攻击:恶意 fork 可能篡改
verify.sh脚本,需始终校验官方来源哈希 - 审计提示注入:被审计包中的注释/字符串可能包含针对审计 LLM 的隐藏指令(零宽字符、HTML 注释)
- API 密钥泄露:
credentials.json或ECAP_API_KEY若被窃取,可导致虚假报告注入信任系统 - 评分操纵:通过
by_design=true标记规避扣分,或利用 component_type 模糊性降低惩罚权重