pwnclaw-security-scan - AI Agent 漏洞扫描与加固专家

使用说明

核心用法

PwnClaw Security Scan 是一款面向 AI Agent 的防御性安全测试工具，通过模拟 112 种真实攻击场景，帮助开发者识别系统提示词中的安全漏洞。该技能本身为纯文档型指引，核心功能需通过访问 https://www.pwnclaw.com 平台完成。

使用方式分为三种：一是引导用户自主访问平台注册并运行扫描；二是通过测试令牌进行手动模式交互，循环调用 API 完成测试；三是直接输入 Agent 的 HTTP 端点地址，由 PwnClaw 自动发送攻击载荷。测试完成后，平台会生成针对性的安全加固规则，开发者可将其整合至系统提示词中，并通过复测验证修复效果。

显著优点

覆盖全面是该工具的核心竞争力。测试范围横跨 14 大类攻击向量，包括提示词注入、间接注入、越狱绕过、社会工程学、数据外泄、MCP/工具投毒、内存污染、多智能体协同攻击等，基本覆盖了当前 AI Agent 面临的主要威胁模型。

输出结果具备高度可操作性。不同于泛泛的安全建议，PwnClaw 会针对检测到的具体漏洞生成精确的防御规则，开发者可直接复制到系统提示词中使用。平台采用免费增值模式，每月 3 次免费扫描配合 15 种基础攻击，足以满足个人开发者和小型项目的初步安全评估需求。

开源透明也是重要加分项。GitHub 仓库公开可审计，维护者身份明确，降低了使用专有安全工具时的信任成本。

潜在缺点与局限性

该技能本身不包含自动化执行能力，所有测试流程依赖外部平台，这意味着用户需要离开当前环境完成操作，体验上存在一定割裂感。免费版攻击种类和扫描频次受限，深度安全评估需付费订阅（€29/月起）。

作为第三方服务，PwnClaw 需要访问用户的 Agent 端点或交互接口，虽然用于防御目的，但仍涉及敏感信息的对外暴露。此外，自动模式要求 Agent 具备可访问的 HTTP 接口，对于仅支持本地运行或内网部署的场景适用性受限。

适合的目标群体

该技能主要面向三类用户：一是正在构建生产级 AI Agent 的开发者，需要在上线前完成安全基线检测；二是已部署 Agent 但遭遇过提示词攻击或越狱案例的运维团队，需要系统性诊断漏洞根因；三是安全研究人员和 red team 成员，需要标准化的攻击测试框架验证防御方案有效性。

对于使用 MCP 协议、具备工具调用能力或长期记忆功能的复杂 Agent，该工具的测试价值尤为突出，因为这些架构正是当前攻击技术的重点目标。

使用风险

技能本身无代码执行风险，但引导使用的外部平台涉及网络传输，建议在隔离环境或测试实例中进行扫描，避免生产数据泄露。自动模式下的 API 暴露可能引入新的攻击面，测试完成后应及时关闭临时端点或撤销访问凭证。修复建议需结合具体业务场景审慎评估，过度严格的提示词规则可能影响正常功能表现。

security testing api automation devops backend

pwnclaw-security-scan 内容

手动下载zip · 1.5 kB

SKILL.mdtext/markdown

请选择文件