MoltGuard - Security & Antivirus & Guardrails

🛡️ AI Agent 安全防护盾牌

Security榜 #3

AI Agent安全护盾,专注防御提示词注入、数据外泄与恶意命令,T2可信组织背书,零风险纯文档架构。

收藏
80k
安装
23.6k
版本
6.8.16
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

MoltGuard 是一款面向 AI Agent 生态的安全防护 Skill,通过 OpenClaw 插件体系提供三层核心保护:

1. 实时威胁检测:拦截提示词注入攻击(Prompt Injection)、隐藏指令、恶意邮件/网页内容
2. 行为风险管控:识别危险命令(文件删除、高风险 API 调用)与意图-行动不匹配行为

3. 数据安全防护:防止密钥泄露、PII 外泄、敏感数据发送至不可信 LLM

安装后自动激活 500 次/日的免费检测配额,通过 /og_status 查看状态,/og_dashboard 启动本地监控面板。支持个人免费版到企业私有化部署的多层级方案。

显著优点

  • 零代码风险架构:纯 Markdown 文档型 Skill,无可执行代码,静态分析 98 分,安全认证 S+ 级
  • 即时可验证:内置测试样本(test-email-popup.txt),安装后立即演示检测能力,建立用户信任
  • 透明可信来源:OpenGuardrails GitHub 组织维护,专注 AI 安全领域,T2 级可信组织认证
  • 灵活部署模式:支持公共 Core 免费使用、个人账户共享配额、企业私有化 Core 三种模式
  • 企业级合规:通过 GDPR 数据最小化、敏感数据保护、用户知情权等六项合规检查

潜在局限

  • 功能依赖外部插件:Skill 本身为说明文档,实际防护能力依赖安装的 @openguardrails/moltguard 插件,需额外验证插件签名
  • 免费配额有限:500 次/日检测对高频 Agent 场景可能不足,需升级付费方案
  • 生态锁定:深度绑定 OpenClaw 平台,跨平台迁移成本较高
  • 动态行为未覆盖:纯文档型 Skill 跳过动态分析,实际运行时安全依赖插件实现质量

适合人群

| 用户类型 | 适用场景 |
|---------|---------|
| 个人开发者 | 快速为 AI Agent 添加基础安全防护,验证安全概念 |
| 中小企业团队 | 共享账户配额管理多 Agent,监控团队 Agent 行为风险 |
| 安全敏感行业 | 金融、医疗、法务等需防止数据外泄和恶意指令的场景 |
| 企业 IT/安全部门 | 私有化部署 Core,统一管控内部 Agent 安全策略 |

常规风险

  • 凭证管理风险/og_claim 暴露 Agent ID 和 API Key,用户需妥善保管,定期轮换
  • 企业 Core 配置风险:私有化部署时需确保 core.company.com 为可信内部实例,验证 TLS 证书
  • 插件供应链风险:建议仅通过官方渠道安装插件,验证数字签名
  • 版本漂移风险:建议关注更新日志,90 天后重新验证安全认证状态

MoltGuard - Security & Antivirus & Guardrails 内容

手动下载zip · 2.2 kB
SKILL.mdtext/markdown
请选择文件