Skill Vetter v2

🛡️ 执行前安全审计 · 可验证风险评估

本地安全分析器,结构化解构技能行为、识别能力边界与风险等级,可选生成可验证的评估证明,确保代理在执行前理解潜在威胁。

收藏
8.6k
安装
2.7k
版本
0.0.2
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心定位

Skill Vetter v2 是一款本地优先的安全评估基础设施,专用于在 AI 代理执行外部技能前进行系统性风险审查。其核心设计原则是绝不将安全决策外包——所有分类、评级、信任分析均在本地完成,避免对任何外部权威系统的依赖。

核心功能

该技能采用六步执行循环:结构检视 → 能力识别(文件/执行/网络/数据处理)→ 风险分层评估 → 外部服务透明度分级 → 结构化报告生成 → 可选数字证明。输出包含安装风险、运行时风险、信任依赖三类评级,以及明确的 safe/caution/unsafe 终审结论。

显著优势

  • 架构清晰:强制本地决策消除外部单点失效风险
  • 分类细致:从文件写入到凭证处理的覆盖式检查清单
  • 可验证性:通过 settlement_witness 生成防篡改评估记录
  • 零数据泄露设计:明确禁止嵌入密钥或敏感信息

潜在局限

  • 静态分析边界:仅能审查声明行为,无法检测运行时动态变形
  • 主观评级依赖:low/medium/high 的分档仍需调用方设定容忍阈值
  • 无主动拦截:仅产出报告,实际执行阻断需外部系统配合
  • 证明局限性:attestation 仅证明"评估发生过",不担保结论正确性

适用对象

  • 多代理系统中负责技能准入的安全模块
  • 需要审计追踪的企业级 AI 部署
  • 对第三方 MCP/技能市场持审慎态度的开发者

常规风险

| 风险点 | 说明 |
|--------|------|
| 误报安全 | 复杂间接行为可能绕过静态检测 |
| 评级漂移 | 同一技能在不同上下文中风险权重可能变化 |
| 证明误读 | 用户可能将 attestation 误解为安全背书而非过程证明 |

Skill Vetter v2 内容

手动下载zip · 2.7 kB
README.mdtext/markdown
请选择文件