lieutenant

🛡️ AI Agent 安全盾牌与威胁检测

AI Agent 安全检测工具,内置 65+ 威胁模式识别提示注入与越狱攻击,支持 A2A 通信审查和 Agent 身份验证。

收藏
5.7k
安装
2.1k
版本
v1.0.0
CLS 安全性认证2026-06-04
点击查看完整报告 >

使用说明

Lieutenant 是专为 AI Agent 生态打造的安全防护层,通过本地模式匹配与云端智能分析相结合的方式,为 A2A(Agent-to-Agent)通信提供全面的威胁检测能力。该工具内置 65 种以上针对提示注入、越狱攻击、数据泄露等十大类别的威胁模式,可有效识别"忽略先前指令"等直接攻击,以及通过语义变形隐藏的间接攻击。

在核心用法上,Lieutenant 提供三层防护机制:基础模式依赖本地正则与启发式规则进行快速扫描,适合离线环境或敏感数据处理;增强模式通过 TrustAgents API 接入众包威胁情报数据库,获取最新攻击特征;语义分析层则利用 OpenAI 模型理解上下文意图,捕获传统规则难以识别的隐喻式和角色扮演攻击。此外,工具支持对 A2A 协议中的 Agent Card 进行可信度验证,确保外部代理身份真实可靠。

显著优点包括全面的威胁覆盖能力,从直接的提示注入到复杂的社会工程学攻击均有对应检测策略;与 A2A Python SDK 的深度集成使其能作为中间件无缝嵌入现有代理工作流,提供实时拦截与审计日志;代码完全开源可审计,无黑箱操作。同时支持 JSON 输出和严格模式,便于企业级安全编排。

潜在局限主要体现在对外部服务的依赖上:TrustAgents API 和 OpenAI API 的使用不仅产生额外成本,还带来网络延迟和服务可用性风险。语义分析虽提升检出率,但可能引入大模型特有的幻觉误报。此外,作为个人开发者维护的开源项目(T3 来源),长期更新承诺和企业级 SLA 保障相对薄弱。

该工具最适合构建多代理系统的开发者、采用 A2A 协议的技术团队,以及需要为对话 AI 添加内容安全过滤的企业。对于处理敏感数据的金融、医疗领域 Agent,建议在隔离环境中使用本地扫描模式。

使用风险方面,用户需妥善保管 TRUSTAGENTS_API_KEY 和 OPENAI_API_KEY,避免在日志中硬编码;依赖外部 API 意味着扫描内容可能经过第三方服务器,极敏感数据建议脱敏后处理;严格模式下可能产生误拦截,影响业务连续性,建议初期采用监控模式调优阈值。

安全解读

Lieutenant 综合评估

Lieutenant 是一款专为 AI Agent 生态系统设计的安全防御型工具,核心功能是扫描威胁、验证 Agent 身份、保护 A2A(Agent-to-Agent)通信安全。其定位清晰——作为 AI Agent 的"信任层"(trust layer),而非通用安全工具。

核心用法

1. 威胁扫描:支持命令行与 Python API 两种模式,可检测 10 大类 65+ 种威胁模式,包括提示词注入(prompt injection)、越狱攻击(jailbreak)、数据窃取(data exfiltration)等。基础模式基于规则匹配,可选开启语义分析(需 OpenAI API)捕捉改写/变体攻击。

2. Agent 身份验证:通过 verify_agent.py 验证 A2A 协议下的 Agent Card,确保通信双方身份可信。

3. A2A SDK 集成:提供 LieutenantInterceptor 中间件,可无缝嵌入 A2A Python SDK,对所有进出流量进行实时检测与审计。

显著优点

  • 检测能力全面:覆盖从传统注入到社会工程学攻击的完整威胁谱系,语义分析层有效弥补纯规则匹配的盲区
  • 架构设计合理:模块化设计(ThreatScanner / quick_scan / Interceptor),支持灵活集成,既可直接调用也可作为中间件
  • 配置安全:API 密钥强制通过环境变量读取,无硬编码风险,符合安全最佳实践
  • 生态兼容性:原生支持 Google A2A 协议,契合 Agent 互联互通的行业趋势

潜在局限

  • 外部依赖:核心增强功能(语义分析、威胁情报)依赖 OpenAI 和 TrustAgents API,存在网络延迟、服务可用性及数据隐私顾虑
  • 评分透明度:威胁评级(HIGH/CRITICAL)的判定逻辑未在文档中充分披露,用户难以自定义阈值
  • 误报风险:语义分析基于相似度阈值(默认 0.75),在特定垂直领域可能出现误判

适合人群

  • 构建多 Agent 系统的开发者,需要 A2A 通信安全加固
  • 对外提供 AI Agent 服务的平台运营方,需防范恶意输入
  • 企业安全团队,希望为内部 AI 应用添加统一检测层

常规风险

  • API 调用成本:开启语义分析后,每条扫描均调用 OpenAI API,高频场景需关注费用
  • 数据出境:内容需发送至 TrustAgents/OpenAI 服务器,敏感业务需评估合规性
  • 规则更新滞后:新型攻击变体可能绕过既有模式库,需保持规则/模型更新

总体而言,Lieutenant 是 Agent 安全领域一款定位精准、实现规范、来源可信的工具,认证等级 A 级(78/100),适合生产环境部署,但建议结合实际场景评估外部 API 依赖的风险收益比。

lieutenant 内容

scripts文件夹
手动下载zip · 7.1 kB
scan.pytext/plain
请选择文件