Input Guard

🛡️ AI Agent的Prompt注入防护盾

AI Agent专用Prompt注入检测盾牌,16类攻击模式识别、多语言支持、零依赖部署,在不可信外部数据进入处理流程前强制拦截。

收藏
10.8k
安装
2.9k
版本
1.0.0
CLS 安全性认证2026-06-04
点击查看完整报告 >

使用说明

核心用法

input-guard是面向AI Agent的输入安全检测层,专门用于扫描从外部不可信来源获取的文本内容,识别并拦截Prompt注入攻击。该技能通过Python标准库实现,无需任何外部依赖,支持16种攻击类别检测(包括指令覆盖、角色操纵、系统伪装、越狱、数据外泄等),覆盖英语、韩语、日语、中文四种语言模式。用户可通过Shell命令行或Python子进程调用,支持inline文本、文件读取、stdin管道三种输入方式,输出提供人类可读、JSON、静默三种格式。

显著优点

  • 防御前置设计:强制要求在Agent处理外部数据前执行扫描,从架构上阻断攻击链路
  • 分级响应机制:5级 severity(SAFE/LOW/MEDIUM/HIGH/CRITICAL)配合明确的处置策略,避免一刀切影响业务
  • 零依赖部署:纯Python标准库实现,无需pip安装,适用于隔离环境、容器、边缘设备
  • 多语言覆盖:针对东亚语言优化的检测模式,解决国际化场景的防护盲区
  • 生态联动:可选集成MoltThreats社区威胁情报,实现攻击样本共享与集体防御
  • 脚本友好:Exit Code设计(0安全/1威胁)便于CI/CD、自动化工作流集成

潜在局限

  • 规则引擎局限:基于正则/模式匹配,对新型变异攻击、语义混淆、上下文依赖的复杂注入可能存在漏检
  • 误报风险:HIGH/paranoid模式下可能出现过度拦截,影响正常内容的处理效率
  • 无深度分析:不提供攻击归因、样本关联、行为溯源等高级威胁情报能力
  • MoltThreats依赖外网:社区上报功能需要网络连通性和API Key,离线环境不可用

适合人群

  • 运营AI Agent自动化工作流的技术团队(爬虫、搜索、API聚合类场景)
  • 需处理用户提交URL、社交媒体内容、第三方RSS/Feed的客服/内容Agent
  • 对供应链安全有要求的金融、政务、医疗领域AI应用开发者
  • 希望快速部署输入防护、不愿引入重型安全基础设施的中小团队

常规风险

  • 绕过风险:攻击者可能通过编码混淆(Base64、零宽字符)、多语言混合、分段投递等方式规避模式检测
  • 性能瓶颈:高频调用场景下,纯Python实现的扫描可能成为I/O瓶颈
  • 配置漂移:sensitivity级别选择不当(过低导致漏报/过高导致业务阻断)需结合业务持续调优
  • 密钥泄露:MOLTHREATS_API_KEY等环境变量若未妥善管理,存在凭证泄露风险

安全解读

Input Guard — AI提示注入防御盾牌

核心定位

input-guard 是一款专门设计用于预防提示注入攻击的防御性安全工具,在AI Agent处理外部不可信内容前建立安全屏障。它通过16类检测规则扫描文本,识别指令覆写、角色操控、越狱攻击等恶意模式。

显著优点

1. 零依赖高安全架构

  • 纯Python标准库实现(仅re/json/base64/argparse),无第三方依赖
  • 彻底规避供应链攻击风险,任何Python 3环境均可运行
  • 获CLS安全认证S级(88分),静态分析、动态行为、隐私合规全项通过

2. 多维度威胁检测

  • 覆盖16类攻击模式:指令覆写、系统模拟、越狱、数据外泄、权限升级等
  • 支持英/韩/日/中四语言检测
  • 4级灵敏度可调(low/medium/high/paranoid)

3. 工程化集成友好

  • 提供shell封装脚本(scan.sh)和原生Python接口
  • JSON/quiet/human-readable三种输出模式
  • 标准退出码(0安全/1威胁),易于CI/CD集成
  • 可选MoltThreats社区威胁情报共享

4. 明确的安全边界

  • 纯本地文本处理,核心功能零网络调用
  • 外部API仅用于可选的威胁报告,需显式配置密钥
  • 无eval/exec/system等危险函数

潜在局限

1. 基于模式匹配的固有局限

  • 正则表达式规则可能被新型攻击变体绕过
  • 高灵敏度模式下误报率上升(paranoid级别)
  • 需持续更新规则库以覆盖新兴攻击手法

2. 社区项目维护风险

  • 来源可信度T3级(个人/社区项目),维护持续性依赖社区
  • 无商业化支持,生产环境需自行承担维护责任

3. 语言覆盖有限

  • 虽支持四语言,但小语种和混合语言攻击检测能力待验证

适合人群

  • AI Agent开发者:需要为Agent添加外部内容安全前置检查
  • 自动化工作流工程师:处理网页抓取、搜索API、社交媒体数据的场景
  • 安全研究人员:研究提示注入防御机制和检测规则优化
  • 隐私敏感用户:希望零依赖、本地化运行的安全工具

常规风险

  • 规则绕过风险:攻击者可能构造针对检测规则的对抗样本
  • 误报导致业务中断:high/paranoid模式可能阻断正常内容
  • 密钥管理:若启用MoltThreats报告,需妥善保护API密钥
  • 依赖扫描结果盲目信任:建议结合多层级防御,不单一依赖此工具

Input Guard 内容

scripts文件夹
手动下载zip · 18.0 kB
report-to-molthreats.shtext/x-shellscript
请选择文件