使用说明

Lieutenant 是专为 AI Agent 生态打造的安全防护层，通过本地模式匹配与云端智能分析相结合的方式，为 A2A（Agent-to-Agent）通信提供全面的威胁检测能力。该工具内置 65 种以上针对提示注入、越狱攻击、数据泄露等十大类别的威胁模式，可有效识别"忽略先前指令"等直接攻击，以及通过语义变形隐藏的间接攻击。

在核心用法上，Lieutenant 提供三层防护机制：基础模式依赖本地正则与启发式规则进行快速扫描，适合离线环境或敏感数据处理；增强模式通过 TrustAgents API 接入众包威胁情报数据库，获取最新攻击特征；语义分析层则利用 OpenAI 模型理解上下文意图，捕获传统规则难以识别的隐喻式和角色扮演攻击。此外，工具支持对 A2A 协议中的 Agent Card 进行可信度验证，确保外部代理身份真实可靠。

显著优点包括全面的威胁覆盖能力，从直接的提示注入到复杂的社会工程学攻击均有对应检测策略；与 A2A Python SDK 的深度集成使其能作为中间件无缝嵌入现有代理工作流，提供实时拦截与审计日志；代码完全开源可审计，无黑箱操作。同时支持 JSON 输出和严格模式，便于企业级安全编排。

潜在局限主要体现在对外部服务的依赖上：TrustAgents API 和 OpenAI API 的使用不仅产生额外成本，还带来网络延迟和服务可用性风险。语义分析虽提升检出率，但可能引入大模型特有的幻觉误报。此外，作为个人开发者维护的开源项目（T3 来源），长期更新承诺和企业级 SLA 保障相对薄弱。

该工具最适合构建多代理系统的开发者、采用 A2A 协议的技术团队，以及需要为对话 AI 添加内容安全过滤的企业。对于处理敏感数据的金融、医疗领域 Agent，建议在隔离环境中使用本地扫描模式。

使用风险方面，用户需妥善保管 TRUSTAGENTS_API_KEY 和 OPENAI_API_KEY，避免在日志中硬编码；依赖外部 API 意味着扫描内容可能经过第三方服务器，极敏感数据建议脱敏后处理；严格模式下可能产生误拦截，影响业务连续性，建议初期采用监控模式调优阈值。

安全解读

Lieutenant 综合评估

Lieutenant 是一款专为 AI Agent 生态系统设计的安全防御型工具，核心功能是扫描威胁、验证 Agent 身份、保护 A2A（Agent-to-Agent）通信安全。其定位清晰——作为 AI Agent 的"信任层"（trust layer），而非通用安全工具。

核心用法

1. 威胁扫描：支持命令行与 Python API 两种模式，可检测 10 大类 65+ 种威胁模式，包括提示词注入（prompt injection）、越狱攻击（jailbreak）、数据窃取（data exfiltration）等。基础模式基于规则匹配，可选开启语义分析（需 OpenAI API）捕捉改写/变体攻击。

2. Agent 身份验证：通过 verify_agent.py 验证 A2A 协议下的 Agent Card，确保通信双方身份可信。

3. A2A SDK 集成：提供 LieutenantInterceptor 中间件，可无缝嵌入 A2A Python SDK，对所有进出流量进行实时检测与审计。

显著优点

检测能力全面：覆盖从传统注入到社会工程学攻击的完整威胁谱系，语义分析层有效弥补纯规则匹配的盲区
架构设计合理：模块化设计（ThreatScanner / quick_scan / Interceptor），支持灵活集成，既可直接调用也可作为中间件
配置安全：API 密钥强制通过环境变量读取，无硬编码风险，符合安全最佳实践
生态兼容性：原生支持 Google A2A 协议，契合 Agent 互联互通的行业趋势

潜在局限

外部依赖：核心增强功能（语义分析、威胁情报）依赖 OpenAI 和 TrustAgents API，存在网络延迟、服务可用性及数据隐私顾虑
评分透明度：威胁评级（HIGH/CRITICAL）的判定逻辑未在文档中充分披露，用户难以自定义阈值
误报风险：语义分析基于相似度阈值（默认 0.75），在特定垂直领域可能出现误判

适合人群

构建多 Agent 系统的开发者，需要 A2A 通信安全加固
对外提供 AI Agent 服务的平台运营方，需防范恶意输入
企业安全团队，希望为内部 AI 应用添加统一检测层

常规风险

API 调用成本：开启语义分析后，每条扫描均调用 OpenAI API，高频场景需关注费用
数据出境：内容需发送至 TrustAgents/OpenAI 服务器，敏感业务需评估合规性
规则更新滞后：新型攻击变体可能绕过既有模式库，需保持规则/模型更新

总体而言，Lieutenant 是 Agent 安全领域一款定位精准、实现规范、来源可信的工具，认证等级 A 级（78/100），适合生产环境部署，但建议结合实际场景评估外部 API 依赖的风险收益比。

security ai-safety api backend development-engineering automation

lieutenant 内容

scripts文件夹

手动下载zip · 7.1 kB

scan.pytext/plain

请选择文件