pwnclaw-security-scan

🛡️ AI Agent 漏洞扫描与加固专家

🥥7总安装量 2评分人数 1
100% 的用户推荐

PwnClaw官方安全扫描工具,通过112种真实攻击测试AI Agent漏洞,提供可落地的修复方案,帮助开发者系统性加固系统提示词安全。

A

基本安全,请在特定环境下使用

  • 来自可信组织或认证账号,需要结合权限范围判断
  • ✅ 纯文档型技能,无代码执行、文件操作或网络请求
  • ✅ 用途为防御性安全测试,非恶意攻击工具
  • ⚠️ 需访问外部平台 https://www.pwnclaw.com,涉及网络传输
  • ⚠️ 自动测试模式需暴露 Agent HTTP 端点,注意访问控制
  • ✅ 源码公开可审计,维护者身份明确

使用说明

核心用法

PwnClaw Security Scan 是一款面向 AI Agent 的防御性安全测试工具,通过模拟 112 种真实攻击场景,帮助开发者识别系统提示词中的安全漏洞。该技能本身为纯文档型指引,核心功能需通过访问 https://www.pwnclaw.com 平台完成。

使用方式分为三种:一是引导用户自主访问平台注册并运行扫描;二是通过测试令牌进行手动模式交互,循环调用 API 完成测试;三是直接输入 Agent 的 HTTP 端点地址,由 PwnClaw 自动发送攻击载荷。测试完成后,平台会生成针对性的安全加固规则,开发者可将其整合至系统提示词中,并通过复测验证修复效果。

显著优点

覆盖全面是该工具的核心竞争力。测试范围横跨 14 大类攻击向量,包括提示词注入、间接注入、越狱绕过、社会工程学、数据外泄、MCP/工具投毒、内存污染、多智能体协同攻击等,基本覆盖了当前 AI Agent 面临的主要威胁模型。

输出结果具备高度可操作性。不同于泛泛的安全建议,PwnClaw 会针对检测到的具体漏洞生成精确的防御规则,开发者可直接复制到系统提示词中使用。平台采用免费增值模式,每月 3 次免费扫描配合 15 种基础攻击,足以满足个人开发者和小型项目的初步安全评估需求。

开源透明也是重要加分项。GitHub 仓库公开可审计,维护者身份明确,降低了使用专有安全工具时的信任成本。

潜在缺点与局限性

该技能本身不包含自动化执行能力,所有测试流程依赖外部平台,这意味着用户需要离开当前环境完成操作,体验上存在一定割裂感。免费版攻击种类和扫描频次受限,深度安全评估需付费订阅(€29/月起)。

作为第三方服务,PwnClaw 需要访问用户的 Agent 端点或交互接口,虽然用于防御目的,但仍涉及敏感信息的对外暴露。此外,自动模式要求 Agent 具备可访问的 HTTP 接口,对于仅支持本地运行或内网部署的场景适用性受限。

适合的目标群体

该技能主要面向三类用户:一是正在构建生产级 AI Agent 的开发者,需要在上线前完成安全基线检测;二是已部署 Agent 但遭遇过提示词攻击或越狱案例的运维团队,需要系统性诊断漏洞根因;三是安全研究人员和 red team 成员,需要标准化的攻击测试框架验证防御方案有效性。

对于使用 MCP 协议、具备工具调用能力或长期记忆功能的复杂 Agent,该工具的测试价值尤为突出,因为这些架构正是当前攻击技术的重点目标。

使用风险

技能本身无代码执行风险,但引导使用的外部平台涉及网络传输,建议在隔离环境或测试实例中进行扫描,避免生产数据泄露。自动模式下的 API 暴露可能引入新的攻击面,测试完成后应及时关闭临时端点或撤销访问凭证。修复建议需结合具体业务场景审慎评估,过度严格的提示词规则可能影响正常功能表现。

pwnclaw-security-scan 内容

手动下载zip · 1.5 kB
SKILL.mdtext/markdown
请选择文件