核心定位
Skill Vetter v2 是一款本地优先的安全评估基础设施,专用于在 AI 代理执行外部技能前进行系统性风险审查。其核心设计原则是绝不将安全决策外包——所有分类、评级、信任分析均在本地完成,避免对任何外部权威系统的依赖。
核心功能
该技能采用六步执行循环:结构检视 → 能力识别(文件/执行/网络/数据处理)→ 风险分层评估 → 外部服务透明度分级 → 结构化报告生成 → 可选数字证明。输出包含安装风险、运行时风险、信任依赖三类评级,以及明确的 safe/caution/unsafe 终审结论。
显著优势
- 架构清晰:强制本地决策消除外部单点失效风险
- 分类细致:从文件写入到凭证处理的覆盖式检查清单
- 可验证性:通过 settlement_witness 生成防篡改评估记录
- 零数据泄露设计:明确禁止嵌入密钥或敏感信息
潜在局限
- 静态分析边界:仅能审查声明行为,无法检测运行时动态变形
- 主观评级依赖:low/medium/high 的分档仍需调用方设定容忍阈值
- 无主动拦截:仅产出报告,实际执行阻断需外部系统配合
- 证明局限性:attestation 仅证明"评估发生过",不担保结论正确性
适用对象
- 多代理系统中负责技能准入的安全模块
- 需要审计追踪的企业级 AI 部署
- 对第三方 MCP/技能市场持审慎态度的开发者
常规风险
| 风险点 | 说明 |
|--------|------|
| 误报安全 | 复杂间接行为可能绕过静态检测 |
| 评级漂移 | 同一技能在不同上下文中风险权重可能变化 |
| 证明误读 | 用户可能将 attestation 误解为安全背书而非过程证明 |