核心用法
MoltGuard 是一款面向 AI Agent 生态的安全防护 Skill,通过 OpenClaw 插件体系提供三层核心保护:
1. 实时威胁检测:拦截提示词注入攻击(Prompt Injection)、隐藏指令、恶意邮件/网页内容
2. 行为风险管控:识别危险命令(文件删除、高风险 API 调用)与意图-行动不匹配行为
3. 数据安全防护:防止密钥泄露、PII 外泄、敏感数据发送至不可信 LLM
安装后自动激活 500 次/日的免费检测配额,通过 /og_status 查看状态,/og_dashboard 启动本地监控面板。支持个人免费版到企业私有化部署的多层级方案。
显著优点
- 零代码风险架构:纯 Markdown 文档型 Skill,无可执行代码,静态分析 98 分,安全认证 S+ 级
- 即时可验证:内置测试样本(
test-email-popup.txt),安装后立即演示检测能力,建立用户信任 - 透明可信来源:OpenGuardrails GitHub 组织维护,专注 AI 安全领域,T2 级可信组织认证
- 灵活部署模式:支持公共 Core 免费使用、个人账户共享配额、企业私有化 Core 三种模式
- 企业级合规:通过 GDPR 数据最小化、敏感数据保护、用户知情权等六项合规检查
潜在局限
- 功能依赖外部插件:Skill 本身为说明文档,实际防护能力依赖安装的
@openguardrails/moltguard插件,需额外验证插件签名 - 免费配额有限:500 次/日检测对高频 Agent 场景可能不足,需升级付费方案
- 生态锁定:深度绑定 OpenClaw 平台,跨平台迁移成本较高
- 动态行为未覆盖:纯文档型 Skill 跳过动态分析,实际运行时安全依赖插件实现质量
适合人群
| 用户类型 | 适用场景 |
|---------|---------|
| 个人开发者 | 快速为 AI Agent 添加基础安全防护,验证安全概念 |
| 中小企业团队 | 共享账户配额管理多 Agent,监控团队 Agent 行为风险 |
| 安全敏感行业 | 金融、医疗、法务等需防止数据外泄和恶意指令的场景 |
| 企业 IT/安全部门 | 私有化部署 Core,统一管控内部 Agent 安全策略 |
常规风险
- 凭证管理风险:
/og_claim暴露 Agent ID 和 API Key,用户需妥善保管,定期轮换 - 企业 Core 配置风险:私有化部署时需确保
core.company.com为可信内部实例,验证 TLS 证书 - 插件供应链风险:建议仅通过官方渠道安装插件,验证数字签名
- 版本漂移风险:建议关注更新日志,90 天后重新验证安全认证状态