ai-sentinel

🛡️ OpenClaw 提示词注入防护网关

🥥38总安装量 14评分人数 20
100% 的用户推荐

OpenClaw 专用提示词注入防火墙,支持本地/云端双模式,提供消息、工具输出全链路安全审查,文件操作需显式确认。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 纯文档型资产,无危险代码执行逻辑,所有文件写入操作均强制要求 AskUserQuestion 显式用户确认
  • ✅ 权限申请与功能完全匹配,无越权行为,不含 eval/exec/subprocess 等高危函数
  • ✅ 数据隐私保护机制完善,Community 模式完全本地运行,Pro 模式具备明确的数据传输通知和用户同意机制
  • ⚠️ 来源为 T3 级个人开发者账号(amandiwakar),非官方组织认证,建议关注上游更新
  • ⚠️ Pro tier 会将消息内容、工具输出和文档文本发送至 https://api.zetro.ai 进行远程分类,虽需用户明确同意,但在高敏感环境中仍需谨慎评估

使用说明

AI Sentinel 是一款专为 OpenClaw 框架设计的提示词注入检测与安全防护技能。该技能通过集成 ai-sentinel-sdk,为 OpenClaw 代理提供从消息输入、工具输出到文档摄入的全链路安全审查能力。用户可根据需求选择 Community(本地)或 Pro(远程 API)两种保护层级,通过配置 openclaw.config.ts 中间件,实现对潜在提示词注入攻击的实时检测与拦截。

核心用法上,AI Sentinel 采用向导式配置流程,引导用户完成 SDK 安装、保护层级选择、检测策略配置(block/quarantine/warn/log)、通道阈值设定(Pro 专属)以及审计日志设置。安装完成后,系统会在消息处理、工具输出、文档摄入和技能安装四个关键节点部署检测中间件,自动识别并处理恶意输入。用户可通过 CLI 命令进行注入测试和状态检查,验证防护效果。

该技能的显著优点在于其完善的安全治理机制。首先,Community tier 完全本地运行,无需网络连接即可实现启发式模型检测,确保敏感数据不出境;其次,所有文件写入操作(包括配置文件修改、环境变量设置、数据目录创建)均强制要求通过 AskUserQuestion 获得用户显式确认,杜绝了自动执行带来的误操作风险;再者,技能提供了多层次的检测能力,不仅覆盖常规消息输入,还能审查工具输出和第三方技能安装包,形成立体防护;最后,完善的审计日志系统(支持 SQLite 本地存储和 Webhook 远程上报)帮助用户追溯安全事件。

然而,该技能也存在一定局限性。Pro tier 虽然提供更高精度的远程分类能力和实时监控仪表盘,但需要将消息内容、工具输出和文档文本发送至 https://api.zetro.ai 进行处理,这对数据隐私要求严格的场景构成挑战;此外,该技能专为 OpenClaw 框架设计,无法直接应用于其他 AI 代理平台;本地 SQLite 审计数据库在长时间运行后可能产生较大的磁盘占用,需要定期维护。

适合使用该技能的目标群体主要包括:部署 OpenClaw 代理并面临提示词注入风险的开发团队、需要符合企业安全合规要求的 AI 应用运维人员、以及对 AI 交互内容有严格审查需求的教育和金融机构。特别是那些希望在本地环境中实现离线安全检测的用户,Community tier 提供了零数据外发的理想方案。

使用过程中的常规风险需引起重视。性能方面,Pro tier 的远程 API 调用会引入网络延迟(默认超时 500ms),在高并发场景下可能成为瓶颈;依赖方面,技能依赖 npm 生态和 ai-sentinel-sdk 包的持续维护,若上游包出现安全漏洞或停止维护,将影响防护能力;配置方面,不当的阈值设置(如过于敏感的 0.5 阈值)可能导致大量误报,影响正常业务流程;此外,虽然文件写入需要确认,但用户在长时间配置过程中可能因习惯性点击而忽视风险提示,因此建议在关键步骤二次确认。

ai-sentinel 内容

手动下载zip · 7.9 kB
CHANGELOG.mdtext/markdown
请选择文件