使用说明

核心用法

stealthy-auto-browse 是一款专为高对抗场景设计的浏览器自动化工具，核心解决标准自动化工具（如 Playwright、Selenium）被 Cloudflare、DataDome、PerimeterX 等反爬系统拦截的问题。技术架构基于 Camoufox（定制 Firefox 内核），完全移除 Chrome DevTools Protocol（CDP）暴露的信号，并采用 PyAutoGUI 实现 OS 级鼠标/键盘输入，使浏览器无法区分人工操作与自动化行为。

使用方式分为三种模式：

HTTP API 模式：通过 POST 请求控制浏览器，支持单实例串行执行或 HAProxy 集群负载均衡
Script 模式：YAML 流水线脚本，stdin 输入、stdout 返回 JSON 结果，适合 CI/CD 集成
Page Loader 模式：URL 触发的自动化钩子，匹配特定域名/路径时自动执行预设流程

关键动作分为两类输入：

System Input（不可检测）：system_click、system_type、mouse_move、send_key、scroll，通过底层系统事件模拟人类行为
Playwright Input（可检测但便捷）：click、fill、type，基于 DOM 事件，适用于无反爬场景

显著优点

1. 极高隐蔽性：零 CDP 暴露、OS 级输入、持久指纹隔离，通过 CreepJS、BrowserScan、Pixelscan 等检测
2. 生产级部署：原生支持 Docker 集群、Redis Cookie 同步、HAProxy 粘性会话、请求队列机制
3. 灵活集成：同时提供 HTTP API、MCP Server、YAML Script 三种接口，覆盖交互式开发与自动化流水线
4. 状态持久：Cookie 跨实例同步、浏览器状态隔离、支持登录会话长期保持
5. 双模输入策略：开发者可根据目标站点的检测强度灵活切换隐蔽/便捷模式

潜在缺点与局限性

1. 资源开销大：每个浏览器实例需独立 Docker 容器，内存占用显著高于 curl 或 headless Chrome
2. 学习曲线陡峭：System Input 需掌握视口坐标计算、人机延迟调优、时区/IP 匹配等反检测细节
3. 单实例串行：未配置集群时请求强制排队，高并发场景需额外部署 HAProxy 与 Redis
4. 仅 Firefox 内核：Camoufox 基于 Gecko，某些 Chrome-only 特性或优化可能缺失
5. 维护依赖性：依赖社区维护的 Camoufox 与 Docker 镜像，版本滞后可能影响隐蔽性

适合人群

数据采集团队：需要稳定绕过企业级反爬系统的爬虫工程师
安全研究员：浏览器指纹检测、自动化对抗技术的研究者
QA/DevOps：需要模拟真实用户行为的端到端测试场景
MCP 生态用户：希望将浏览器能力接入 AI Agent 工作流的开发者

常规风险

法律合规：明确禁止用于未授权数据采集、账户滥用、自动化攻击等违法场景
服务条款冲突：即使技术绕过成功，也可能违反目标站点的 ToS
指纹关联：持久指纹若被标记，可能导致整批实例被关联封禁
资源滥用：集群模式下的 Redis、HAProxy 配置不当可能导致状态泄漏或请求风暴

browser-automation anti-detection camoufox cloudflare-bypass docker mcp-server web-scraping fingerprint-stealth

stealthy-auto-browse 内容

references文件夹

手动下载zip · 7.1 kB

setup.mdtext/markdown

请选择文件