prompt-injection-guard

🛡️ 零依赖的提示注入防御指南

🥥5总安装量 2评分人数 3
100% 的用户推荐

来自 openclaw/skills 仓库的纯文档型安全防御指南,提供提示注入攻击检测与多层防御策略,零代码执行风险,为 AI 系统提供系统级安全加固能力。

A

基本安全,请在特定环境下使用

  • 来自可信来源(Github / Microsoft / 官方仓库)
  • ✅ 零代码执行:纯 Markdown 文档,无动态执行能力,从根本上消除代码注入风险
  • ✅ 零权限请求:未申请任何文件系统、网络、环境变量访问权限
  • ✅ 零外部依赖:无 npm/Python 包或远程资源引用,供应链攻击面为零
  • ⚠️ 被动防御局限:仅为指导文档,实际防护效果依赖人工实施质量
  • ⚠️ 规则更新需求:攻击模式快速演化,需定期同步上游仓库更新检测规则

使用说明

核心用法

prompt-injection-guard 是一个专门用于防御提示注入攻击的安全技能,采用纯文档形式提供系统化的防御策略。该技能通过三层检测机制(Level 1-3)对输入进行实时扫描,识别直接注入、间接注入、角色变更攻击、信息泄露攻击和授权绕过等五类主要威胁模式。核心防御手段包括:输入边界明确化(使用 START/END 标记隔离用户输入)、危险模式正则匹配、输出敏感信息过滤、以及外部数据上下文隔离。

显著优点

该技能具有极高的安全性设计:零代码执行、零权限请求、零外部依赖,从根本上消除了供应链攻击和代码注入风险。防御策略覆盖全面,从输入处理到输出过滤形成完整闭环,特别针对加密资产和社交媒体场景提供了专项防护规则。文档结构清晰,包含可落地的 YAML 配置示例和检查清单,便于工程化实施。作为被动防御指南,不会影响系统性能,可与现有安全体系无缝集成。

潜在缺点与局限性

作为纯文档型技能,其有效性完全依赖人工实施质量,无法自动拦截攻击。检测规则基于静态模式匹配,可能产生误报或漏检新型攻击变体(如编码绕过、多语言混淆)。规则库需要持续更新以应对快速演化的攻击技术,文档中未提供自动化更新机制。此外,该技能本身不提供运行时保护,若实施不当(如边界标记被用户预测),防御效果将大打折扣。

适合的目标群体

主要面向 AI 应用开发者、AI 安全工程师、智能合约/加密资产平台运维团队,以及需要处理不可信用户输入的客服机器人、内容审核系统开发者。特别适合已具备基础安全能力、需要系统化加固提示层防御的中大型项目团队。

使用风险

常规风险包括:规则误报导致正常用户体验受损;防御规则被攻击者逆向分析后针对性绕过;多语言混合输入场景下的检测盲区。建议配合 human-securitysecurity-review` 等关联技能形成纵深防御,并建立攻击日志监控与规则迭代机制。

prompt-injection-guard 内容

手动下载zip · 3.0 kB
SKILL.mdtext/markdown
请选择文件