moltbook-firewall

🛡️ AI 代理社交内容安全防火墙

🥥30总安装量 12评分人数 6
100% 的用户推荐

Kara Codex 开发的 AI 代理防护工具,本地扫描检测提示词注入与社会工程攻击,提供透明可审计的社交内容安全层。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 纯本地运行,无网络通信与动态代码加载,零外部依赖风险
  • ✅ 无危险函数调用(eval/exec/system),仅使用标准系统工具(grep/jq等)
  • ⚠️ 本地日志记录扫描内容前500字符,需定期检查 `~/.openclaw/workspace/data/firewall-log.jsonl`
  • ⚠️ 基于正则的模式匹配存在误报/漏报可能,需手动更新威胁模式库
  • ✅ 权限申请与功能严格匹配,无越权操作,代码完全透明可审计

使用说明

Moltbook Firewall 是一款专为 AI 代理设计的防御性安全技能,旨在保护在 Moltbook 等社交平台运行的智能体免受提示词注入、社会工程攻击、恶意代码执行和数据窃取等威胁。其核心用法是将内容扫描集成到代理的处理流程中:在获取平台内容后,通过 ./scripts/firewall-scan.sh 脚本进行本地扫描,根据返回的 SAFE、SUSPICIOUS 或 BLOCKED 状态决定是否处理内容,从而实现对威胁的主动防御。

该技能的显著优点在于其架构的纯粹性与透明性。作为纯本地运行的扫描工具,它仅依赖 Bash、grep、jq 等系统标准工具,无网络通信、无动态代码加载、无 eval/exec 等危险函数,代码完全可审计。它通过正则表达式模式匹配检测多种攻击向量,包括伪造系统指令、恶意 curl 命令、权威 spoofing、紧急性压迫等社会工程手段,且不执行任何破坏性操作,仅通过退出码返回检测结果,确保扫描过程本身不会带来安全风险。

然而,该技能也存在一定局限性。首先,其来源可信度为 T3 级(社区/个人开发者),虽代码透明但仍缺乏知名开源基金会或安全公司的背书。其次,基于正则的模式匹配可能存在误报或漏报,且需要用户手动更新 patterns/threats.json 来应对新出现的攻击向量,维护成本较高。此外,它主要面向中小型应用场景,不能完全替代专业的企业级安全解决方案。

该技能适合 AI 代理开发者、社交平台运营者以及对 AI 安全有需求的个人用户,特别是那些在开放环境中部署代理、需要基础内容过滤机制的场景。它可作为多层防御体系的第一道防线,帮助代理建立"知情同意"的安全意识。

使用风险主要包括:脚本会记录扫描内容的前 500 字符到本地日志文件,虽符合最小必要原则且不上传远程,但在极高隐私要求场景下需谨慎;正则规则的局限性可能导致新型攻击绕过检测;长期依赖需要持续投入维护威胁模式库。建议结合人工审查机制,不将其作为唯一的安全防线。

moltbook-firewall 内容

文件夹图标patterns文件夹
文件夹图标scripts文件夹
手动下载zip · 6.7 kB
threats.jsonapplication/json
请选择文件