Name: 第三方技能的安全策略网关
Author: authensor

使用说明

核心用法

Authensor Gateway 作为 OpenClaw 生态的策略门禁系统，为第三方市场技能提供三层分级管控：低风险操作（文件读取、搜索）自动放行；高风险操作（文件写入、命令执行、网络请求）触发人工审批；危险操作（删除、密钥访问）默认阻断。用户需配置 CONTROL_PLANE_URL 和 AUTHENSOR_API_KEY 后，系统通过提示词级强制协议注入系统指令，要求 LLM 在每步工具调用前向控制平面发送元数据（仅动作类型+资源路径，不含文件内容或对话历史），获取 allow/deny/require_approval 决策后方可执行。

显著优点

隐私优先设计：控制平面仅接收动作元数据（如 filesystem.write + /tmp/file），绝不传输 API 密钥、文件内容或对话记录，从源头消除数据泄露风险
人机协同治理：区别于全自动化或全锁定模式，提供精细化的"人-in-the-loop"审批流，生成带 receipt ID 的审计追踪，满足合规场景（SOX、GDPR 等）的溯源要求
开源透明：MIT 许可证完整开源（github.com/AUTHENSOR/Authensor-for-OpenClaw），策略规则与数据流向可审计
故障安全（Fail-Closed）：控制平面不可达时，系统指令强制拒绝所有操作，避免"静默放行"的安全空洞
轻量零侵入：纯提示词指令实现，无代码执行、无磁盘写入、无进程派生，仅通过 disable-model-invocation: true 确保用户主动启用

潜在缺点与局限性

提示词级依赖：当前 OpenClaw 无 preToolExecution 运行时钩子， enforcement 完全依赖 LLM 对系统指令的遵循。理论上，对抗性提示注入可能诱导模型跳过策略检查，尽管文档声称 LLM "generally follow reliably"
模型自分类风险：动作类型（如将 Bash 归类为 safe.read 或 code.exec）由 LLM 自主判断，恶意构造的指令可能诱导错误分类（如将 curl | sh 伪装成 echo）以绕过规则
网络单点依赖：策略决策必须实时连接 Authensor 控制平面，离线环境完全不可用；Render 托管的免费 tier 存在 30-60 秒冷启动延迟
审批延迟：邮件/轮询式审批机制存在 5 分钟级延迟，实时协作场景体验受限
生态成熟度：OpenClaw 自身处于发展期（preToolExecution hooks 待实现 Issue #10502），当前防护层级受平台能力天花板制约

适合人群

必须运行第三方市场技能的开发者/团队（ClawHavoc 研究显示 ClawHub 存在 341 个恶意技能）
需要审计追踪与合规证据的企业用户（金融、医疗、政务等监管场景）
追求数据零出境的隐私敏感用户（元数据级上传 vs. 全量数据上传方案）
不适合：纯内置工具用户、已部署完全网络隔离 Docker 沙箱的环境、或无法接受实时联网依赖的离线场景

常规风险

供应链攻击面：控制平面代码与托管基础设施（Render）成为信任根，若其遭受入侵或 DNS 劫持，可能返回恶意 allow 决策或拦截合法流量
API 密钥管理：AUTHENSOR_API_KEY 泄露可导致策略规则被篡改或审批流被注入，需按文档要求严格隔离（不得暴露于输出）
误报/漏报权衡：保守分类策略可能过度阻断正常开发工作流（如频繁的 npm install 需反复审批），宽松策略则可能放过边缘风险
LLM 行为漂移：不同模型版本对系统指令的遵循度存在差异，升级底层模型（如 Claude 3.5→4）可能意外改变 enforcement 有效性

安全解读

核心用法

Authensor Gateway 是一款面向 OpenClaw 生态的纯指令级安全策略门控工具，通过向系统提示词注入「Agent Protocol」实现工具调用拦截。安装后，所有第三方技能的工具调用在执行前必须经过策略检查：低风险操作（如读取文件、搜索）自动放行；高风险操作（如写文件、执行命令、网络请求）触发人工审批；危险操作（如删除、访问密钥）默认阻断。

使用流程：用户配置 CONTROL_PLANE_URL 与 AUTHENSOR_API_KEY → 启用技能 → 每次工具调用前 Agent 自动向控制平面发送元数据（仅含 action type + resource + tool name）→ 接收 allow/deny/require_approval 决策 → 按指令执行或等待用户通过邮件/CLI 审批。

显著优点

零代码入侵：纯 Markdown 文档型 Skill，无安装脚本、不写磁盘、不启动进程，完全依赖提示词注入实现策略检查
数据最小化：仅传输 action metadata，绝不发送文件内容、API 密钥或对话历史，符合 GDPR/CCPA
Fail-closed 设计：控制平面不可达时默认拒绝所有操作，而非静默放行
来源可信：GitHub 组织 AUTHENSOR 维护，MIT 开源，透明披露局限性
审计追踪：每次操作生成 receipt ID，支持合规审计

潜在缺点与局限性

| 局限类别 | 具体说明 |

|---------|---------|

| **提示词级 enforcement** | 依赖 LLM 遵循系统提示词，非加密级或运行时级保证；理论上存在对抗性提示注入绕过的可能 |

| **无原生运行时钩子** | OpenClaw 尚未提供 `preToolExecution` hooks，作者已标注待 Issue #10502 解决后方可升级 |

| **模型驱动分类** | Agent 自主判定 action type，若被误导分类可能绕过策略规则 |

| **网络依赖** | 必须连通控制平面，离线不可用；托管于 Render 存在 cold start 延迟（30-60s） |

| **审批延迟** | 邮件审批轮询机制，实时性不足（5 分钟级），实时通道仍在 roadmap |

| **Demo 层级限制** | 演示 Key 7 天有效期、速率限制、策略定制受限 |

适合人群

使用第三方市场技能（尤其是含 Bash/文件写入/网络请求）的开发者
需要「人工审批+审计日志」满足合规（SOC2、ISO27001 等）要求的团队
对「数据不出境/不上云」有顾虑，希望明确知晓何种元数据外发的隐私敏感用户
已启用 Docker sandbox、希望叠加策略层防御的深度安全用户

常规风险

1. 提示词绕过风险：若其他 Skill 或用户输入成功注入高优先级指令覆盖 Agent Protocol，策略检查可能被跳过
2. 控制平面单点故障：Render 托管的服务可用性、API Key 泄露或过期均会导致工作流中断
3. 审批流程摩擦：高频写操作场景下，轮询等待可能显著降低开发效率
4. 分类误判：Agent 对复杂 Bash 命令的分类可能不够精准，需用户二次确认

policy-gate openclaw third-party-risk audit-trail human-in-the-loop prompt-security access-control compliance

Authensor Gateway 内容

手动下载zip · 5.3 kB

SKILL.mdtext/markdown

请选择文件