使用说明

核心用法

input-guard是面向AI Agent的输入安全检测层，专门用于扫描从外部不可信来源获取的文本内容，识别并拦截Prompt注入攻击。该技能通过Python标准库实现，无需任何外部依赖，支持16种攻击类别检测（包括指令覆盖、角色操纵、系统伪装、越狱、数据外泄等），覆盖英语、韩语、日语、中文四种语言模式。用户可通过Shell命令行或Python子进程调用，支持inline文本、文件读取、stdin管道三种输入方式，输出提供人类可读、JSON、静默三种格式。

显著优点

防御前置设计：强制要求在Agent处理外部数据前执行扫描，从架构上阻断攻击链路
分级响应机制：5级 severity（SAFE/LOW/MEDIUM/HIGH/CRITICAL）配合明确的处置策略，避免一刀切影响业务
零依赖部署：纯Python标准库实现，无需pip安装，适用于隔离环境、容器、边缘设备
多语言覆盖：针对东亚语言优化的检测模式，解决国际化场景的防护盲区
生态联动：可选集成MoltThreats社区威胁情报，实现攻击样本共享与集体防御
脚本友好：Exit Code设计（0安全/1威胁）便于CI/CD、自动化工作流集成

潜在局限

规则引擎局限：基于正则/模式匹配，对新型变异攻击、语义混淆、上下文依赖的复杂注入可能存在漏检
误报风险：HIGH/paranoid模式下可能出现过度拦截，影响正常内容的处理效率
无深度分析：不提供攻击归因、样本关联、行为溯源等高级威胁情报能力
MoltThreats依赖外网：社区上报功能需要网络连通性和API Key，离线环境不可用

适合人群

运营AI Agent自动化工作流的技术团队（爬虫、搜索、API聚合类场景）
需处理用户提交URL、社交媒体内容、第三方RSS/Feed的客服/内容Agent
对供应链安全有要求的金融、政务、医疗领域AI应用开发者
希望快速部署输入防护、不愿引入重型安全基础设施的中小团队

常规风险

绕过风险：攻击者可能通过编码混淆（Base64、零宽字符）、多语言混合、分段投递等方式规避模式检测
性能瓶颈：高频调用场景下，纯Python实现的扫描可能成为I/O瓶颈
配置漂移：sensitivity级别选择不当（过低导致漏报/过高导致业务阻断）需结合业务持续调优
密钥泄露：MOLTHREATS_API_KEY等环境变量若未妥善管理，存在凭证泄露风险

安全解读

Input Guard — AI提示注入防御盾牌

核心定位

input-guard 是一款专门设计用于预防提示注入攻击的防御性安全工具，在AI Agent处理外部不可信内容前建立安全屏障。它通过16类检测规则扫描文本，识别指令覆写、角色操控、越狱攻击等恶意模式。

显著优点

1. 零依赖高安全架构

纯Python标准库实现（仅re/json/base64/argparse），无第三方依赖
彻底规避供应链攻击风险，任何Python 3环境均可运行
获CLS安全认证S级（88分），静态分析、动态行为、隐私合规全项通过

2. 多维度威胁检测

覆盖16类攻击模式：指令覆写、系统模拟、越狱、数据外泄、权限升级等
支持英/韩/日/中四语言检测
4级灵敏度可调（low/medium/high/paranoid）

3. 工程化集成友好

提供shell封装脚本（scan.sh）和原生Python接口
JSON/quiet/human-readable三种输出模式
标准退出码（0安全/1威胁），易于CI/CD集成
可选MoltThreats社区威胁情报共享

4. 明确的安全边界

纯本地文本处理，核心功能零网络调用
外部API仅用于可选的威胁报告，需显式配置密钥
无eval/exec/system等危险函数

潜在局限

1. 基于模式匹配的固有局限

正则表达式规则可能被新型攻击变体绕过
高灵敏度模式下误报率上升（paranoid级别）
需持续更新规则库以覆盖新兴攻击手法

2. 社区项目维护风险

来源可信度T3级（个人/社区项目），维护持续性依赖社区
无商业化支持，生产环境需自行承担维护责任

3. 语言覆盖有限

虽支持四语言，但小语种和混合语言攻击检测能力待验证

适合人群

AI Agent开发者：需要为Agent添加外部内容安全前置检查
自动化工作流工程师：处理网页抓取、搜索API、社交媒体数据的场景
安全研究人员：研究提示注入防御机制和检测规则优化
隐私敏感用户：希望零依赖、本地化运行的安全工具

常规风险

规则绕过风险：攻击者可能构造针对检测规则的对抗样本
误报导致业务中断：high/paranoid模式可能阻断正常内容
密钥管理：若启用MoltThreats报告，需妥善保护API密钥
依赖扫描结果盲目信任：建议结合多层级防御，不单一依赖此工具

prompt-injection input-validation security-scanning ai-safety threat-detection agent-security zero-dependency multi-language

Input Guard 内容

scripts文件夹

手动下载zip · 18.0 kB

report-to-molthreats.shtext/x-shellscript

请选择文件