使用说明

核心用法

browser skill 通过 browse CLI 提供自然语言驱动的浏览器自动化能力，支持两类运行模式：

本地模式（默认）：直接调用本地 Chrome，零配置即可使用，适合开发调试、访问无防护的简单站点（文档、维基、公开API等）。

Browserbase远程模式：配置 BROWSERBASE_API_KEY 与 BROWSERBASE_PROJECT_ID 后激活，提供企业级反爬虫能力：

隐身模式（自定义 Chromium 指纹、反 bot 检测）
自动 CAPTCHA 破解（reCAPTCHA、hCaptcha、Turnstile）
201国住宅代理，支持地理定位
会话持久化（cookie/登录态跨会话保留）

典型工作流：browse open URL → browse snapshot 获取可访问性树与元素引用 → 使用 @0-5 等引用执行 click/fill/type 交互 → 循环验证直至完成 → browse stop 清理会话。

显著优点

1. 双模式灵活切换：同一命令集适配开发与生产场景，本地失败一键切远程
2. 结构化快照优先：snapshot 返回可访问性树（比截图快、省 vision token），元素引用 @x-y 精准可靠
3. 生产级反爬能力：Browserbase 模式自动处理 Cloudflare、IP 封禁、设备指纹检测
4. 会话管理完整：多标签页、前进/后退、表单状态、环境切换均支持
5. MIT 开源协议：CLI 本身开源，Browserbase 服务按需付费

潜在局限

本地模式无防护：易被目标站识别为 bot，返回 403/空页面/检测页
远程模式依赖第三方：需 Browserbase 账号与有效 API 额度，网络延迟略高于本地
元素引用非持久：@x-y 随页面重载变化，需每次重新 snapshot
复杂交互需组合命令：拖拽、滚动、多步表单填写需多命令串联
无内置数据解析：提取的 HTML/text 需额外处理（jq/regex 等）

适合人群

数据工程师/爬虫开发者：需绕过反爬机制采集公开数据
QA/自动化测试人员：快速验证 Web 流程、截图比对
AI Agent 构建者：为 LLM 提供"能动手操作浏览器"的工具能力
市场调研/竞品分析：需登录后抓取 dashboard、价格信息

常规风险

| 风险类型 | 说明 | 缓解建议 |

|---------|------|---------|

| 账号封禁 | 高频访问可能导致目标站账号/IP被封 | 启用 residential proxy、控制请求频率、使用 session 持久化减少登录次数 |

| 服务依赖 | Browserbase 服务中断或额度耗尽影响生产 | 本地模式作为 fallback，监控 API 额度 |

| 数据隐私 | 远程模式流量经 Browserbase 基础设施 | 敏感内部系统优先使用本地模式 |

| 僵尸进程 | daemon 异常退出可能导致 Chrome 残留 | 定期 `browse status` 检查，`pkill` 清理 |

| 法律合规 | 自动化访问受 ToS 限制的网站可能违规 | 遵守 robots.txt 与网站服务条款，仅采集公开数据 |

总体评估：技能设计成熟，文档完备，双模式架构兼顾灵活与鲁棒，是 LLM 时代浏览器自动化的务实选择。

安全解读

核心用法

该 Skill 是 Browserbase 官方推出的浏览器自动化封装工具，通过 browse CLI 将自然语言指令转换为浏览器操作。采用双模式架构：本地模式使用系统 Chrome，零配置开箱即用；远程模式接入 Browserbase 云端浏览器，自动激活反检测隐身模式、reCAPTCHA/hCaptcha 自动破解、201 国住宅代理及会话持久化。核心工作流为 browse open → browse snapshot 获取带元素引用的无障碍树 → browse click/@ref 交互 → 循环验证，最终以 browse stop 清理会话。

显著优点

1. 企业级反爬能力：远程模式基于定制 Chromium 指纹和住宅 IP，可穿透 Cloudflare、DataDome 等主流防护
2. 成本灵活：本地模式免费开发调试，远程模式按量付费，无强制订阅
3. 结构化交互：browse snapshot 返回可编程的元素引用（如 @0-5），避免脆弱 CSS 选择器
4. 会话治理完善：支持多标签管理、环境切换、守护进程状态监控

潜在局限

外部依赖重：核心功能完全托管于 @browserbasehq/browse-cli，Skill 本身无可执行代码，若 CLI 出现 Breaking Change 或服务中断，功能即失效
远程模式成本：住宅代理和验证码破解按调用计费，高频抓取成本累积显著
本地模式受限：无隐身能力，易被反爬拦截，需频繁切换模式
网络延迟：远程模式因代理转发，响应较本地慢 200-500ms

适合人群

数据工程师/研究员：需抓取 JavaScript 渲染页面或登录态内容
自动化测试团队：替代 Selenium/Puppeteer 的轻量方案
合规采集需求方：Browserbase 的代理池和反检测降低法律风险

常规风险

1. API 密钥泄露：远程模式需配置 BROWSERBASE_API_KEY，若硬编码于脚本或 CI 日志，可能导致账户盗刷
2. 服务条款边界：自动化访问部分网站可能违反 robots.txt 或用户协议，需自行合规审查
3. CLI 供应链风险：npm 全局安装包存在被劫持可能，建议锁定版本并校验签名

browser-automation web-scraping cli-tool captcha-solving anti-bot playwright chromium browserbase data-extraction headless-browser

Browserbase 内容

手动下载zip · 9.6 kB

EXAMPLES.mdtext/markdown

请选择文件