使用说明

核心用法

stealth-browser 是一款专为绕过网站反爬虫机制设计的浏览器自动化 Skill。它基于 Puppeteer 框架，通过 puppeteer-extra-plugin-stealth 插件实现浏览器指纹伪装，并可选配 Smartproxy 住宅代理服务突破 IP 封锁。用户可通过命令行快速启动隐身浏览器会话，支持网页截图、HTML 内容提取、纯文本抓取三种输出模式，也可作为模块导入 JavaScript 项目调用。

典型使用场景包括：访问被 Cloudflare/Vercel 防护的网站、抓取 Reddit/Twitter 等社交平台数据、自动化注册流程测试、以及需要模拟真人行为的 Web 自动化任务。基础用法仅需执行 node scripts/browser.js "URL"，添加 --proxy 参数即可启用住宅代理，配合 --screenshot、、--html 或 --text` 指定输出格式。

显著优点

该 Skill 的最大优势在于其开箱即用的反检测能力。相比原生 Puppeteer，它自动应用了 20 余项隐身规避策略，包括移除 navigator.webdriver 标记、伪造 Chrome 121 用户代理、模拟真实插件列表和语言设置、覆盖 WebGL/Canvas 指纹等。测试验证可有效通过 sannysoft.com 等 bot 检测站点，对 Relay.link、X/Twitter、Reddit 等曾封锁自动化工具的平台均有良好兼容性。

住宅代理集成是另一核心亮点。通过 Smartproxy 的住宅 IP 池，可突破数据中心 IP 的地理封锁和频率限制，支持按国家区域（如 _area-US）和会话粘性（_life-30）精细配置。相比自建代理基础设施，该方案降低了运维复杂度，适合中小规模的数据采集需求。

潜在缺点与局限性

首先，该 Skill 无法完全消除 CAPTCHA 挑战，仅能降低触发概率。对于强防护站点，仍需配合 2captcha 等验证码解决服务。其次，高级 JavaScript 指纹分析（如 Canvas 哈希、WebGL 渲染差异）在部分高安全级别站点仍可能识别出自动化特征。此外，住宅代理按流量计费（约 $7.50/GB），单页加载成本约 $0.01-0.03，高频使用场景下成本累积显著。

技术层面，Stealth 插件和代理路由会引入额外延迟，页面加载速度低于直接请求。依赖项方面，Puppeteer 需要完整的 Chromium 运行环境，在容器化或资源受限环境中部署需额外配置系统依赖。最后，该工具的设计初衷涉及规避网站安全机制，存在合规性灰色地带。

适合的目标群体

主要面向三类用户：一是数据工程师和爬虫开发者，需要采集受反爬机制保护的公开数据；二是 QA 自动化测试人员，需在真实浏览器环境中验证用户注册、登录等流程；三是安全研究人员，用于测试网站防护机制的有效性。对于仅需简单页面抓取的轻量用户，该 Skill 的功能过剩且成本不经济；而对于大规模商业爬虫团队，Smartproxy 的流量成本可能高于自建代理池方案。

使用风险

性能风险方面，Chromium 实例内存占用较高（通常 300-500MB 每实例），并发场景需合理控制实例数量。依赖风险方面，Puppeteer 版本与 Chromium 版本强绑定，升级可能导致行为变化。成本风险方面，代理流量消耗难以精确预估，建议启用前在 Smartproxy 控制台设置用量告警。合规风险方面，使用该 Skill 访问网站可能违反目标站点的服务条款，需自行评估法律后果。配置风险方面，代理凭据以明文存储于本地 JSON 文件，若权限设置不当（未设为 600）可能导致敏感信息泄露。

安全解读

核心用法

Stealth Browser 基于 puppeteer-extra 和 stealth plugin 构建，通过模拟真实浏览器环境绕过各类反爬机制。基础用法直接运行脚本访问目标 URL，可选 --proxy 启用住宅代理突破 IP 封锁，支持 --screenshot、--html、--text 三种输出模式。代理配置需创建 ~/.config/smartproxy/proxy.json 文件，支持地理定位和会话保持。

显著优点

多层反检测：自动移除 navigator.webdriver 标记、伪造 Chrome UA、模拟插件和权限，通过 sannysoft.com 等检测网站验证
灵活代理支持：可选 Smartproxy 住宅代理，有效突破 Cloudflare、Vercel、Reddit 等平台的 IP 层封锁
低成本起步：无代理模式下可免费使用，仅在 IP 封锁场景下按需付费（约 $0.01-0.03/页）
即开即用：Node.js 单文件脚本，无需复杂配置即可运行

潜在局限

依赖漏洞：存在 4 个间接依赖 CVE（1 Critical + 1 High + 2 Moderate），需手动更新修复
非万能绕过：高级 Canvas/WebGL 指纹分析仍可能检测，CAPTCHA 仅减少触发率无法完全消除
性能开销：代理路由和 stealth 伪装增加延迟，不适合高频低延迟场景
沙箱降级：容器环境使用 --no-sandbox 启动，隔离性略有降低

适合人群

需要采集受保护网站数据的开发者/研究人员
遭遇 Cloudflare/Vercel 拦截的自动化测试工程师
有合规数据采集需求、具备技术排查能力的个人或小型团队
已拥有 Smartproxy 或其他住宅代理账户的用户

常规风险

法律合规：绕过反爬机制可能违反目标网站 ToS， residential 代理流量通过真实住宅 IP，需严格遵守使用条款和当地法律
凭证泄露：代理配置文件需严格设置 600 权限，避免提交至 Git
供应链安全：T3 来源（个人开发者）无组织背书，依赖更新需自行关注
成本失控：住宅代理按流量计费，高频调用可能产生意外费用，建议监控用量

automation content-media data-analytics development-engineering testing

stealth-browser 内容

scripts文件夹

手动下载zip · 21.5 kB

browser.jstext/javascript

请选择文件