OpenGuardrails

🛡️ AI Agent 实时安全护栏

MoltGuard 是由 OpenGuardRails 开发的专业 AI 安全护栏,实时检测提示注入、数据外泄、PII 泄露及恶意命令等风险,为 AI Agent 提供企业级安全防护。

收藏
8.4k
安装
2.4k
版本
6.8.20
CLS 安全性认证2026-05-18
点击查看完整报告 >

使用说明

核心功能

MoltGuard 是一款面向 AI Agent 的综合安全护栏系统,通过「Core」后端服务实现实时威胁检测。其核心能力覆盖三大风险面:

1. 指令/提示风险:检测提示注入攻击、恶意邮件/网页指令、未授权任务等
2. 行为风险:拦截危险命令执行、文件删除、高风险 API 调用

3. 数据风险:防止密钥泄露、PII 外泄、敏感数据流向 LLM

技术亮点在于「意图-行为不匹配检测」,可识别 AI Agent 言行不一的异常行为。

显著优势

  • 即装即用:安装后自动获取 API Key,500 次/天免费额度
  • 多层防护:覆盖文件读取、网页浏览、命令执行等全场景
  • 企业就绪:支持私有化 Core 部署,提供完整的设备注册/管理流程
  • 透明计费:阶梯定价清晰,从免费到企业级按需扩展

局限与风险

  • 依赖外部服务:所有检测由 Core 后端完成,需网络连接,存在单点依赖
  • 配额限制:免费版仅 500 次/天,高频场景需付费
  • 闭源黑箱:检测规则未开源,用户无法审计或自定义检测逻辑
  • 新兴项目:OpenGuardRails 组织较新,长期维护稳定性待验证

适合人群

  • 使用 AI Agent/Claude 处理敏感业务数据的企业用户
  • 担心提示注入、数据外泄的安全敏感型开发者
  • 需要集中管理多 Agent 安全策略的组织

风险提示

插件需持续联网与 Core 服务通信,可能产生数据隐私顾虑;建议企业用户优先评估私有化部署方案。

安全解读

核心用法

MoltGuard 是专为 OpenClaw 生态打造的安全防护 Skill,通过集成 Core 安全引擎为 AI 代理提供三层防护:

安装与激活

openclaw plugins install @openguardrails/moltguard

安装后自动获取 API Key,500 次/日免费额度立即可用。首次安装建议执行测试命令 cat ~/.openclaw/extensions/moltguard/samples/test-email-popup.txt 验证防护生效。

日常管理命令

  • /og_status — 查看配额、计划、API Key 状态
  • /og_dashboard — 启动本地监控面板
  • /og_claim + /og_core — 绑定多设备共享配额
  • enterprise-enroll.mjs — 企业私有化 Core 接入

防护范围
1. 指令风险:提示注入、恶意邮件/网页指令、未授权任务

2. 行为风险:危险命令、文件删除、高风险 API 调用

3. 数据风险:密钥泄露、PII 外泄、敏感数据发送至 LLM

核心技术为「意图-行为不匹配检测」,可识别「说一套做一套」的隐蔽攻击。

---

显著优点

| 维度 | 表现 |
|------|------|
| **零配置即用** | 安装即生效,无需人工干预获取凭证 |
| **多层防护** | 覆盖提示注入、数据外泄、命令注入三大攻击面 |
| **企业就绪** | 支持私有化 Core 部署,满足合规要求 |
| **透明计费** | 免费→$199/月 五档清晰,无隐藏消费 |
| **来源可信** | GitHub 组织账号维护,T2 级可信来源 |

---

局限性与风险

1. 配额限制:免费版 500 次/日,高频场景需付费升级
2. 云端依赖:检测逻辑依赖 Core 云端服务,断网或企业 Core 故障时失效

3. 纯文档型 Skill:当前版本无本地可执行代码,功能深度受限于 Core 能力边界

4. 企业配置风险:私有化部署需自行验证 Core 服务端身份,配置错误可能导致防护绕过

---

适合人群

  • 个人开发者:使用 OpenClaw 的 AI 代理用户,关注基础安全防护
  • 中小团队:需共享配额、监控多代理安全状态的开发团队
  • 企业安全团队:有私有化部署需求、需合规审计的金融/医疗/政务场景

---

常规风险提示

  • API Key 存储于本地 ~/.openclaw/credentials/,需做好文件权限管控
  • 企业 Core URL 配置务必使用 HTTPS,避免中间人攻击
  • 卸载命令执行后需重启 OpenClaw 才能完全清除配置残留

OpenGuardrails 内容

手动下载zip · 2.2 kB
SKILL.mdtext/markdown
请选择文件