核心用法
MoltGuard 是专为 OpenClaw agents 设计的运行时安全插件,安装后自动提供三层核心防护:
1. 指令风险防护:检测提示词注入攻击、隐藏于邮件/网页中的恶意指令、未授权任务执行
2. 行为风险拦截:识别危险命令、文件删除操作、高风险 API 调用
3. 数据泄露防护:阻断密钥泄露、PII 暴露、敏感数据外传至 LLM
安装与激活(零配置):
openclaw plugins install @openguardrails/moltguard openclaw gateway restart
安装后自动注册并获取 API 密钥,500 次/天免费配额立即生效。建议通过读取测试文件验证防护生效:
cat ~/.openclaw/extensions/moltguard/samples/test-email-popup.txt
核心命令:
/og_status— 查看 API 密钥、配额使用及防护状态/og_claim— 关联账户实现多 Agent 配额共享/og_dashboard— 启动本地监控面板/og_core— 进入账户管理与计费门户
显著优点
- 开箱即用:自动注册、自动获取凭证,无需手动配置
- 意图-行为 mismatch 检测:核心技术创新,捕获"说一套做一套"的恶意 Agent 行为
- 多层级防护:覆盖输入层(prompt)、执行层(command)、输出层(data)完整攻击面
- 配额弹性:免费档 500 次/天满足个人开发者,付费档最高 200 万次/月支持企业规模
- 可信来源:OpenGuardrails 专注 AI Agent 安全护栏领域,GitHub 组织账号可追溯
潜在局限
- 网络依赖:所有检测由 Core 云端服务执行,离线环境失效
- 配额焦虑:免费 500 次/天在高频场景下可能吃紧,需监控或升级
- 生态绑定:仅兼容 OpenClaw agent 框架,无法迁移至其他平台
- License 缺失:当前未明确声明开源协议,商业使用需谨慎
适合人群
- OpenClaw agent 开发者及重度用户
- 处理敏感数据(PII、密钥)的 AI 工作流
- 需防御提示词注入/数据外泄的企业级 Agent 部署
- 安全意识强、愿为防护付费的个人开发者
常规风险
- 服务可用性:依赖 OpenGuardrails Core 服务连续性
- 隐私考量:检测请求需上传至云端分析,敏感内容可能暴露
- 误报可能:意图检测算法可能对复杂指令产生误判
- 付费陷阱:超出配额后可能中断防护,关键业务需提前规划套餐