Authensor Gateway

🛡️ 第三方技能的安全策略网关

OpenClaw 第三方技能的安全网关,通过策略拦截高危工具调用,仅上传元数据实现隐私保护的人机协同审批。

收藏
5.2k
安装
2.5k
版本
0.5.1
CLS 安全性认证2026-05-20
点击查看完整报告 >

使用说明

核心用法

Authensor Gateway 作为 OpenClaw 生态的策略门禁系统,为第三方市场技能提供三层分级管控:低风险操作(文件读取、搜索)自动放行;高风险操作(文件写入、命令执行、网络请求)触发人工审批;危险操作(删除、密钥访问)默认阻断。用户需配置 CONTROL_PLANE_URLAUTHENSOR_API_KEY 后,系统通过提示词级强制协议注入系统指令,要求 LLM 在每步工具调用前向控制平面发送元数据(仅动作类型+资源路径,不含文件内容或对话历史),获取 allow/deny/require_approval 决策后方可执行。

显著优点

  • 隐私优先设计:控制平面仅接收动作元数据(如 filesystem.write + /tmp/file),绝不传输 API 密钥、文件内容或对话记录,从源头消除数据泄露风险
  • 人机协同治理:区别于全自动化或全锁定模式,提供精细化的"人-in-the-loop"审批流,生成带 receipt ID 的审计追踪,满足合规场景(SOX、GDPR 等)的溯源要求
  • 开源透明:MIT 许可证完整开源(github.com/AUTHENSOR/Authensor-for-OpenClaw),策略规则与数据流向可审计
  • 故障安全(Fail-Closed):控制平面不可达时,系统指令强制拒绝所有操作,避免"静默放行"的安全空洞
  • 轻量零侵入:纯提示词指令实现,无代码执行、无磁盘写入、无进程派生,仅通过 disable-model-invocation: true 确保用户主动启用

潜在缺点与局限性

  • 提示词级依赖:当前 OpenClaw 无 preToolExecution 运行时钩子, enforcement 完全依赖 LLM 对系统指令的遵循。理论上,对抗性提示注入可能诱导模型跳过策略检查,尽管文档声称 LLM "generally follow reliably"
  • 模型自分类风险:动作类型(如将 Bash 归类为 safe.readcode.exec)由 LLM 自主判断,恶意构造的指令可能诱导错误分类(如将 curl | sh 伪装成 echo)以绕过规则
  • 网络单点依赖:策略决策必须实时连接 Authensor 控制平面,离线环境完全不可用;Render 托管的免费 tier 存在 30-60 秒冷启动延迟
  • 审批延迟:邮件/轮询式审批机制存在 5 分钟级延迟,实时协作场景体验受限
  • 生态成熟度:OpenClaw 自身处于发展期(preToolExecution hooks 待实现 Issue #10502),当前防护层级受平台能力天花板制约

适合人群

  • 必须运行第三方市场技能的开发者/团队(ClawHavoc 研究显示 ClawHub 存在 341 个恶意技能)
  • 需要审计追踪与合规证据的企业用户(金融、医疗、政务等监管场景)
  • 追求数据零出境的隐私敏感用户(元数据级上传 vs. 全量数据上传方案)
  • 不适合:纯内置工具用户、已部署完全网络隔离 Docker 沙箱的环境、或无法接受实时联网依赖的离线场景

常规风险

  • 供应链攻击面:控制平面代码与托管基础设施(Render)成为信任根,若其遭受入侵或 DNS 劫持,可能返回恶意 allow 决策或拦截合法流量
  • API 密钥管理AUTHENSOR_API_KEY 泄露可导致策略规则被篡改或审批流被注入,需按文档要求严格隔离(不得暴露于输出)
  • 误报/漏报权衡:保守分类策略可能过度阻断正常开发工作流(如频繁的 npm install 需反复审批),宽松策略则可能放过边缘风险
  • LLM 行为漂移:不同模型版本对系统指令的遵循度存在差异,升级底层模型(如 Claude 3.5→4)可能意外改变 enforcement 有效性

安全解读

核心用法

Authensor Gateway 是一款面向 OpenClaw 生态的纯指令级安全策略门控工具,通过向系统提示词注入「Agent Protocol」实现工具调用拦截。安装后,所有第三方技能的工具调用在执行前必须经过策略检查:低风险操作(如读取文件、搜索)自动放行;高风险操作(如写文件、执行命令、网络请求)触发人工审批;危险操作(如删除、访问密钥)默认阻断。

使用流程:用户配置 CONTROL_PLANE_URLAUTHENSOR_API_KEY → 启用技能 → 每次工具调用前 Agent 自动向控制平面发送元数据(仅含 action type + resource + tool name)→ 接收 allow/deny/require_approval 决策 → 按指令执行或等待用户通过邮件/CLI 审批。

显著优点

  • 零代码入侵:纯 Markdown 文档型 Skill,无安装脚本、不写磁盘、不启动进程,完全依赖提示词注入实现策略检查
  • 数据最小化:仅传输 action metadata,绝不发送文件内容、API 密钥或对话历史,符合 GDPR/CCPA
  • Fail-closed 设计:控制平面不可达时默认拒绝所有操作,而非静默放行
  • 来源可信:GitHub 组织 AUTHENSOR 维护,MIT 开源,透明披露局限性
  • 审计追踪:每次操作生成 receipt ID,支持合规审计

潜在缺点与局限性

| 局限类别 | 具体说明 |
|---------|---------|
| **提示词级 enforcement** | 依赖 LLM 遵循系统提示词,非加密级或运行时级保证;理论上存在对抗性提示注入绕过的可能 |
| **无原生运行时钩子** | OpenClaw 尚未提供 `preToolExecution` hooks,作者已标注待 Issue #10502 解决后方可升级 |
| **模型驱动分类** | Agent 自主判定 action type,若被误导分类可能绕过策略规则 |
| **网络依赖** | 必须连通控制平面,离线不可用;托管于 Render 存在 cold start 延迟(30-60s) |
| **审批延迟** | 邮件审批轮询机制,实时性不足(5 分钟级),实时通道仍在 roadmap |
| **Demo 层级限制** | 演示 Key 7 天有效期、速率限制、策略定制受限 |

适合人群

  • 使用第三方市场技能(尤其是含 Bash/文件写入/网络请求)的开发者
  • 需要「人工审批+审计日志」满足合规(SOC2、ISO27001 等)要求的团队
  • 对「数据不出境/不上云」有顾虑,希望明确知晓何种元数据外发的隐私敏感用户
  • 已启用 Docker sandbox、希望叠加策略层防御的深度安全用户

常规风险

1. 提示词绕过风险:若其他 Skill 或用户输入成功注入高优先级指令覆盖 Agent Protocol,策略检查可能被跳过
2. 控制平面单点故障:Render 托管的服务可用性、API Key 泄露或过期均会导致工作流中断

3. 审批流程摩擦:高频写操作场景下,轮询等待可能显著降低开发效率

4. 分类误判:Agent 对复杂 Bash 命令的分类可能不够精准,需用户二次确认

Authensor Gateway 内容

手动下载zip · 5.3 kB
SKILL.mdtext/markdown
请选择文件