使用说明

核心用法

MoltGuard 是一款面向 AI Agent 生态的安全防护 Skill，通过 OpenClaw 插件体系提供三层核心保护：

1. 实时威胁检测：拦截提示词注入攻击（Prompt Injection）、隐藏指令、恶意邮件/网页内容
2. 行为风险管控：识别危险命令（文件删除、高风险 API 调用）与意图-行动不匹配行为
3. 数据安全防护：防止密钥泄露、PII 外泄、敏感数据发送至不可信 LLM

安装后自动激活 500 次/日的免费检测配额，通过 /og_status 查看状态，/og_dashboard 启动本地监控面板。支持个人免费版到企业私有化部署的多层级方案。

显著优点

零代码风险架构：纯 Markdown 文档型 Skill，无可执行代码，静态分析 98 分，安全认证 S+ 级
即时可验证：内置测试样本（test-email-popup.txt），安装后立即演示检测能力，建立用户信任
透明可信来源：OpenGuardrails GitHub 组织维护，专注 AI 安全领域，T2 级可信组织认证
灵活部署模式：支持公共 Core 免费使用、个人账户共享配额、企业私有化 Core 三种模式
企业级合规：通过 GDPR 数据最小化、敏感数据保护、用户知情权等六项合规检查

潜在局限

功能依赖外部插件：Skill 本身为说明文档，实际防护能力依赖安装的 @openguardrails/moltguard 插件，需额外验证插件签名
免费配额有限：500 次/日检测对高频 Agent 场景可能不足，需升级付费方案
生态锁定：深度绑定 OpenClaw 平台，跨平台迁移成本较高
动态行为未覆盖：纯文档型 Skill 跳过动态分析，实际运行时安全依赖插件实现质量

适合人群

| 用户类型 | 适用场景 |

|---------|---------|

| 个人开发者 | 快速为 AI Agent 添加基础安全防护，验证安全概念 |

| 中小企业团队 | 共享账户配额管理多 Agent，监控团队 Agent 行为风险 |

| 安全敏感行业 | 金融、医疗、法务等需防止数据外泄和恶意指令的场景 |

| 企业 IT/安全部门 | 私有化部署 Core，统一管控内部 Agent 安全策略 |

常规风险

凭证管理风险：/og_claim 暴露 Agent ID 和 API Key，用户需妥善保管，定期轮换
企业 Core 配置风险：私有化部署时需确保 core.company.com 为可信内部实例，验证 TLS 证书
插件供应链风险：建议仅通过官方渠道安装插件，验证数字签名
版本漂移风险：建议关注更新日志，90 天后重新验证安全认证状态

安全解读

核心用法

MoltGuard 是专为 OpenClaw AI Agent 设计的开源安全护栏插件，通过安装即可启用三层防护：提示/指令风险检测（防范 prompt injection 和恶意指令）、行为风险监控（拦截危险命令和 API 调用）、数据风险防护（阻止密钥和 PII 泄露）。安装后使用 openclaw plugins install @openguardrails/moltguard 即可激活，无需复杂配置即享每日 500 次免费检测额度。

显著优点

即装即用：纯文档型插件无执行代码，安装后自动生效，零配置门槛
三重防护覆盖：同步防御 prompt injection、数据外泄、恶意命令三大核心攻击面
意图-行为匹配检测：独特的技术机制，捕获"说一套做一套"的隐蔽攻击
弹性计费模式：免费层 500 次/日满足个人开发者，付费计划 19-199 美元/月覆盖团队协作
企业级部署支持：提供私有 Core 部署和批量设备注册脚本，满足合规需求
S+ 顶级安全认证：通过六维深度检测（静态分析、动态行为、依赖审计、网络流量、隐私合规、威胁情报），满分 100 分

潜在局限

依赖外部 Core 服务：检测逻辑由远程 Core 执行，需网络连接，存在供应商锁定风险
免费额度有限制：500 次/日对高频自动化场景可能不足，超限需付费
企业功能待验证：文档提及的 enterprise-enroll 脚本和 core.company.com 端点需实际部署验证
许可证未明确：当前版本未声明开源协议，存在法律不确定性

适合人群

使用 OpenClaw 框架的 AI Agent 开发者
需要基础安全防护的个人开发者和小团队（免费层）
有合规需求的企业客户（支持私有 Core 部署）
关注 prompt injection 和数据泄露风险的 LLM 应用运维者

常规风险

供应链风险：虽来源可信（T2 级 GitHub 组织），但 Core 服务为闭源组件，需信任 OpenGuardrails 运营方
数据流向：检测请求需发送至 Core 服务，虽使用 TLS 1.2+ 加密，但敏感数据仍离开本地环境
功能完整性：作为早期版本（v6.8.16），企业级功能和稳定性需生产环境验证
许可证风险：未明确开源协议可能影响商业使用和二次开发

security prompt-injection data-exfiltration guardrails ai-safety agent-security compliance enterprise-deployment

MoltGuard - Security & Antivirus & Guardrails 内容

手动下载zip · 2.2 kB

SKILL.mdtext/markdown

请选择文件