stealthy-auto-browse

🕵️ 零痕迹浏览器自动化,穿透企业级反爬

browser-automation榜 #11

基于 Camoufox 的零 CDP 浏览器自动化方案,通过 OS 级输入模拟绕过 Cloudflare 等反爬系统,专为高对抗场景设计

收藏
13.3k
安装
3k
版本
1.4.0
CLS 安全性认证2026-05-22
点击查看完整报告 >

使用说明

核心定位

stealthy-auto-browse 是一款面向高级反爬对抗场景设计的浏览器自动化技能,采用 Camoufox(Firefox 定制分支)作为浏览器引擎,彻底规避 Chrome DevTools Protocol 暴露的检测风险。其核心创新在于零 CDP 信号 + OS 级输入模拟:通过 PyAutoGUI 生成真实的操作系统级鼠标/键盘事件,使浏览器自身无法感知自动化痕迹,从而穿透 CreepJS、BrowserScan、Pixelscan 及 Cloudflare 等企业级防护体系。

显著优点

1. 对抗能力业界领先

  • 完全消除 CDP 协议暴露(Firefox 基础架构无 CDP)
  • OS 级输入事件无法被 JavaScript 行为分析检测
  • 通过主流指纹扫描器测试(CreepJS、BrowserScan、Pixelscan)
  • 支持持久化指纹与用户配置(mount /userdata

2. 双模式操作灵活

  • System Input(隐形模式)system_clicksystem_typesend_key 等,模拟真实人类交互轨迹(贝塞尔曲线鼠标移动、抖动延迟、随机化打字间隔)
  • Playwright Input(快速模式):标准 DOM 操作,适合非对抗场景

3. 工程化功能完备

  • Page Loader 机制:URL 触发自动化脚本,类似 Greasemonkey 服务端化
  • Script Mode:YAML 驱动的一次性执行流程,无需 HTTP 服务
  • 内置隐私扩展:uBlock Origin、LocalCDN、ClearURLs、Consent-O-Matic
  • 网络日志捕获、多 Tab 管理、文件上传下载、对话框处理

4. 部署与集成友好

  • 纯 Docker 容器化,单端口 HTTP API
  • 内置 noVNC 实时可视化调试(5900 端口)
  • 支持代理注入、时区匹配、自定义分辨率

潜在局限与风险

1. 性能与资源开销

  • 需要完整 Xvfb 虚拟显示环境,内存占用显著高于 headless 模式
  • 人类化模拟(鼠标轨迹、打字延迟)主动牺牲执行速度
  • Docker 容器启动时间数秒级,不适合高频短时任务

2. 技术复杂度曲线陡峭

  • 坐标系管理:viewport 坐标与 screen 坐标的偏移校准(calibratewindow_offset
  • 必须预先调用 get_interactive_elements 获取精确坐标,无法直接复用 CSS Selector
  • 全屏/窗口状态切换后需重新校准,增加状态管理负担

3. 维护与生态风险

  • 依赖 Camoufox 单一上游 fork,更新频率与 Firefox 主线同步存在滞后风险
  • 开源项目(psyb0t/docker-stealthy-auto-browse)维护者为个人开发者,长期可持续性存疑
  • 无官方商业支持,企业级 SLA 缺失

4. 合规与法律边界模糊

  • 明确设计用于"actively fighting automation"站点的突破,可能触发服务条款违约
  • 持久化指纹技术可绕过平台账户风控,存在滥用风险

适用人群

| 场景 | 推荐度 |
|------|--------|
| 数据采集工程师(反爬对抗场景) | ⭐⭐⭐⭐⭐ |
| 安全研究员/渗透测试人员 | ⭐⭐⭐⭐⭐ |
| 需要登录态保持的长期监控任务 | ⭐⭐⭐⭐⭐ |
| 简单静态页面爬取 | ⭐☆☆☆☆(过度设计)|
| 高频低延迟 API 测试 | ⭐☆☆☆☆(性能不匹配)|
| 合规敏感型企业生产环境 | ⭐⭐☆☆☆(需法律评估)|

常规风险提示

  • IP/时区一致性:必须将容器 TZ 与代理 IP 地理位置匹配,否则成为显著检测特征
  • 指纹一致性:频繁更换指纹比固定指纹更易触发风控,建议持久化 profile
  • 行为节奏控制:即使使用隐形模式,过于机械的执行间隔仍需 sleep 或随机延迟模拟
  • 资源泄漏:未关闭的 Tab、未清理的下载文件在长期使用中需监控
  • 升级兼容性:Camoufox 版本升级可能导致指纹特征变化,需重新验证 stealth 效果

安全解读

核心功能与用法

stealthy-auto-browse 是一款专为对抗现代bot检测系统设计的浏览器自动化方案。它采用Camoufox(Firefox定制分支)作为核心浏览器,完全规避了Chrome DevTools Protocol(CDP)暴露的检测面;同时通过PyAutoGUI在操作系统层面模拟鼠标和键盘输入,使得浏览器本身无法区分自动化操作与真实用户行为。

核心使用流程:启动Docker容器暴露8080端口API → 设置STEALTHY_AUTO_BROWSE_URL环境变量 → 发送JSON命令至HTTP端点。关键动作包括:goto导航、get_interactive_elements获取可交互元素坐标、system_click/system_type执行OS级点击和输入、get_text提取页面内容。

两种输入模式

  • System Input(隐匿模式)system_clicksystem_typemouse_movesend_keyscroll等,通过PyAutoGUI生成真实OS事件,完全无法被JavaScript检测
  • Playwright Input(便捷模式)clickfilltype等,直接操作DOM,速度快但存在被行为分析识别的风险

高级功能:Page Loaders(URL触发自动化脚本)、Script Mode(YAML编排无人值守执行)、网络日志捕获、多标签管理、Cookie/Storage操作、文件上传下载等。

显著优点

1. 零CDP暴露:采用Firefox而非Chromium,彻底消除DevTools Protocol这一最常被检测的自动化特征
2. OS级输入不可检测:鼠标移动带有人类化的贝塞尔曲线和随机抖动,键盘输入模拟真实击键间隔,浏览器层面无法识别为自动化

3. 持久化指纹:通过/userdata挂载实现Cookie、LocalStorage、浏览器指纹跨会话保持

4. 绕过主流防护:明确针对并测试通过CreepJS、BrowserScan、Pixelscan及Cloudflare挑战页面

5. 灵活部署:支持HTTP API交互模式、YAML脚本批量执行模式,以及实时VNC观测

6. 预装隐私扩展:内置uBlock Origin、LocalCDN、ClearURLs、Consent-O-Matic,减少追踪面

潜在局限与缺点

1. Docker依赖:必须运行容器,资源占用高于轻量级HTTP请求工具
2. 坐标运算开销:隐匿模式需要先从get_interactive_elements获取像素坐标,开发流程比CSS选择器更繁琐

3. 速度权衡system_type逐字符输入带随机延迟,显著慢于fill的直接赋值

4. 单点故障:功能完全依赖第三方维护的Docker镜像,更新和安全补丁不受用户控制

5. 容器逃逸风险:运行不受信任镜像存在潜在的容器安全边界突破可能

适用人群

  • 数据抓取工程师:需要绕过Cloudflare、DataDome、PerimeterX、Akamai等企业级防护
  • 账户自动化开发者:需要创建不易被封禁的长期登录会话
  • 安全研究员:测试网站bot检测机制,验证指纹隐匿方案有效性
  • 竞品情报分析:获取反爬虫严格保护的公开数据

不适用场景:简单静态页面抓取(curl即可)、无防护站点的快速自动化(标准Playwright更快)、仅需HTML源码无需渲染的情况。

常规风险

| 风险类型 | 具体描述 | 缓解建议 |
|---------|---------|---------|
| 合规风险 | 绕过bot检测可能违反目标网站ToS | 确认获得授权,遵守robots.txt,符合GDPR等法规 |
| 镜像安全风险 | Docker镜像由个人开发者维护,内容不可完全审计 | 运行前审查Dockerfile,使用只读文件系统,限制资源和网络 |
| 账户封禁 | 即使技术隐匿,行为模式异常仍可能触发风控 | 模拟真实浏览节奏,添加合理延迟,分散请求时间 |
| 时区/IP不匹配 | 系统时区与代理IP地理位置不一致是常见检测信号 | 通过`-e TZ=...`匹配代理所在时区 |
| 法律责任 | 用于未经授权的账户访问或数据采集可能涉及违法 | 仅用于合法授权场景,避免绕过明确安全机制 |

stealthy-auto-browse 内容

手动下载zip · 13.6 kB
SKILL.mdtext/markdown
请选择文件