使用说明

核心功能

MoltGuard 是一款面向 AI Agent 的综合安全护栏系统，通过「Core」后端服务实现实时威胁检测。其核心能力覆盖三大风险面：

1. 指令/提示风险：检测提示注入攻击、恶意邮件/网页指令、未授权任务等
2. 行为风险：拦截危险命令执行、文件删除、高风险 API 调用
3. 数据风险：防止密钥泄露、PII 外泄、敏感数据流向 LLM

技术亮点在于「意图-行为不匹配检测」，可识别 AI Agent 言行不一的异常行为。

显著优势

即装即用：安装后自动获取 API Key，500 次/天免费额度
多层防护：覆盖文件读取、网页浏览、命令执行等全场景
企业就绪：支持私有化 Core 部署，提供完整的设备注册/管理流程
透明计费：阶梯定价清晰，从免费到企业级按需扩展

局限与风险

依赖外部服务：所有检测由 Core 后端完成，需网络连接，存在单点依赖
配额限制：免费版仅 500 次/天，高频场景需付费
闭源黑箱：检测规则未开源，用户无法审计或自定义检测逻辑
新兴项目：OpenGuardRails 组织较新，长期维护稳定性待验证

适合人群

使用 AI Agent/Claude 处理敏感业务数据的企业用户
担心提示注入、数据外泄的安全敏感型开发者
需要集中管理多 Agent 安全策略的组织

风险提示

插件需持续联网与 Core 服务通信，可能产生数据隐私顾虑；建议企业用户优先评估私有化部署方案。

安全解读

核心用法

MoltGuard 是专为 OpenClaw 生态打造的安全防护 Skill，通过集成 Core 安全引擎为 AI 代理提供三层防护：

安装与激活

openclaw plugins install @openguardrails/moltguard

安装后自动获取 API Key，500 次/日免费额度立即可用。首次安装建议执行测试命令 cat ~/.openclaw/extensions/moltguard/samples/test-email-popup.txt 验证防护生效。

日常管理命令

/og_status — 查看配额、计划、API Key 状态
/og_dashboard — 启动本地监控面板
/og_claim + /og_core — 绑定多设备共享配额
enterprise-enroll.mjs — 企业私有化 Core 接入

防护范围
1. 指令风险：提示注入、恶意邮件/网页指令、未授权任务
2. 行为风险：危险命令、文件删除、高风险 API 调用
3. 数据风险：密钥泄露、PII 外泄、敏感数据发送至 LLM

核心技术为「意图-行为不匹配检测」，可识别「说一套做一套」的隐蔽攻击。

---

显著优点

| 维度 | 表现 |

|------|------|

| **零配置即用** | 安装即生效，无需人工干预获取凭证 |

| **多层防护** | 覆盖提示注入、数据外泄、命令注入三大攻击面 |

| **企业就绪** | 支持私有化 Core 部署，满足合规要求 |

| **透明计费** | 免费→$199/月 五档清晰，无隐藏消费 |

| **来源可信** | GitHub 组织账号维护，T2 级可信来源 |

---

局限性与风险

1. 配额限制：免费版 500 次/日，高频场景需付费升级
2. 云端依赖：检测逻辑依赖 Core 云端服务，断网或企业 Core 故障时失效
3. 纯文档型 Skill：当前版本无本地可执行代码，功能深度受限于 Core 能力边界
4. 企业配置风险：私有化部署需自行验证 Core 服务端身份，配置错误可能导致防护绕过

---

适合人群

个人开发者：使用 OpenClaw 的 AI 代理用户，关注基础安全防护
中小团队：需共享配额、监控多代理安全状态的开发团队
企业安全团队：有私有化部署需求、需合规审计的金融/医疗/政务场景

---

常规风险提示

API Key 存储于本地 ~/.openclaw/credentials/，需做好文件权限管控
企业 Core URL 配置务必使用 HTTPS，避免中间人攻击
卸载命令执行后需重启 OpenClaw 才能完全清除配置残留

security prompt-injection data-exfiltration guardrails agent-security pii-protection credential-theft safety enterprise-security

OpenGuardrails 内容

手动下载zip · 2.2 kB

SKILL.mdtext/markdown

请选择文件