Name: 安全可控的浏览器自动化助手
Author: faisalive

使用说明

Browser Ability Skill 是一款专为 AI Agent 设计的浏览器自动化工具，通过 Chrome DevTools Protocol (CDP) 连接浏览器实例，使 Agent 能够安全地访问需要用户认证的网站并检索数据。该技能采用独特的"人工介入"（Human-in-the-Loop）设计，在自动化效率与账号安全之间取得了精妙平衡。

核心用法围绕 MCP（Model Context Protocol）工具调用展开。用户可通过 npm run call 命令调用预定义工具（如 amazon_get_purchase_history），或直接通过 CDP 连接操控浏览器。当遇到需要登录的场景时，系统会返回 signin_id 和登录 URL，Agent 必须将登录过程交接给真实用户手动完成，待用户确认后再使用 signinId 参数恢复数据获取流程。这种设计既保留了自动化的便利性，又将敏感的认证环节牢牢控制在用户手中。

显著优点体现在其卓越的安全架构上。首先，代码层面完全杜绝了危险函数（如 eval、exec、system），采用标准 ES Module 导入语法，杜绝代码注入风险。其次，依赖管理严谨，使用官方 @modelcontextprotocol/sdk 并锁定版本（package-lock.json 完备），无动态代码加载。最重要的是其隐私保护设计：不静默收集密码、Cookie 等敏感凭据，仅通过临时的 signin_id 进行会话管理，且强制要求用户手动在浏览器中完成登录流程，从根本上避免了凭证泄露风险。

潜在局限性主要包括来源可信度和使用门槛。作为 T3 级社区项目（个人开发者 faisalive 维护），缺乏大型开源基金会或企业的背书。功能上，人工介入机制虽然安全，但意味着无法实现完全无人值守的自动化，不适合对延迟敏感的高频任务。此外，用户需要自行配置 CDP_URL 和 SERVER_URL 环境变量，并确保远程 MCP 服务器的可信度，这对非技术用户存在一定门槛。

适合的目标群体包括：需要定期从电商平台、银行等需登录网站获取数据的开发者；构建复杂 AI Agent 工作流的技术团队；以及注重账号安全的自动化测试人员。特别适合那些既希望享受自动化便利，又不愿将网站凭证交由 AI 自动处理的隐私敏感型用户。

使用风险主要涉及配置安全和传输安全。CDP_URL 若指向不受控的浏览器实例可能导致会话劫持，建议仅在隔离环境中运行。SERVER_URL 必须使用 HTTPS 协议，防止 x-cdp-url 和 x-signin-id 等头部信息在传输过程中被截获。此外，虽然技能本身不存储凭证，但用户仍需警惕钓鱼风险，确保手动登录的 URL 域名正确无误。建议在容器化或虚拟机环境中部署，以进一步降低潜在风险。

安全解读

核心用法

Browser Ability Skill 是一款基于 Chrome DevTools Protocol (CDP) 的浏览器自动化技能，允许 AI Agent 通过 JavaScript 脚本与网站交互并采集数据。其核心能力包括：

1. 浏览器远程控制：通过 CDP URL 连接用户本地或远程浏览器实例，执行页面导航、元素操作等任务
2. 工具化接口：提供标准化的工具调用方式（npm run call -- TOOL_NAME），将常用网站操作封装为可复用组件
3. 人机协作登录：对于需要身份验证的网站（如亚马逊、银行等），采用"Agent 提示 → 用户手动登录 → Agent 恢复执行"的安全流程，严禁自动化登录操作
4. 回退机制：当无可用工具时，直接通过 CDP 操作浏览器完成自定义任务

显著优点

安全优先设计：强制人工介入敏感认证环节，避免凭证泄露和自动化滥用的法律风险
协议标准化：基于 MCP (Model Context Protocol) 与浏览器通信，接口规范且可扩展
灵活部署：支持本地浏览器 CDP 连接，用户完全掌控数据流向
会话管理：通过 signin_id 机制实现认证状态的持久化和安全传递

潜在局限与风险

| 维度 | 说明 |

|------|------|

| **技术门槛** | 需自行配置 CDP URL 和 MCP 服务器，对非技术用户不够友好 |

| **网络依赖** | 依赖外部 MCP 服务器稳定性，断连会导致任务中断 |

| **浏览器兼容性** | 仅支持 Chromium 系浏览器的 CDP 协议 |

| **间接依赖风险** | 依赖树中存在非关键路径的 CVE（如 @hono/node-server、ajv） |

| **配置安全责任** | 服务端 URL 由用户配置，若指向不可信服务器存在中间人风险 |

适合人群

需要自动化采集个人数据的技术用户（如导出电商订单、银行流水）
企业自动化测试工程师，需绕过复杂登录流程的 UI 测试场景
隐私敏感型用户，希望数据在本地浏览器处理而非云端

常规风险管控

严格遵循"不自动登录"原则，所有凭证输入必须由用户亲自完成
生产环境强制使用 HTTPS/WSS 加密连接，避免 SIGNIN_ID 泄露
定期执行 npm audit fix 修复间接依赖漏洞
仅连接可信来源的 MCP 服务器，验证证书有效性

automation data-analytics backend development-engineering browser-automation

browser-ability 内容

手动下载zip · 14.0 kB

package-lock.jsonapplication/json

请选择文件