核心用法
stealthy-auto-browse 是一款专为高对抗场景设计的浏览器自动化工具,核心解决标准自动化工具(如 Playwright、Selenium)被 Cloudflare、DataDome、PerimeterX 等反爬系统拦截的问题。技术架构基于 Camoufox(定制 Firefox 内核),完全移除 Chrome DevTools Protocol(CDP)暴露的信号,并采用 PyAutoGUI 实现 OS 级鼠标/键盘输入,使浏览器无法区分人工操作与自动化行为。
使用方式分为三种模式:
- HTTP API 模式:通过
POST请求控制浏览器,支持单实例串行执行或 HAProxy 集群负载均衡 - Script 模式:YAML 流水线脚本,stdin 输入、stdout 返回 JSON 结果,适合 CI/CD 集成
- Page Loader 模式:URL 触发的自动化钩子,匹配特定域名/路径时自动执行预设流程
关键动作分为两类输入:
- System Input(不可检测):
system_click、system_type、mouse_move、send_key、scroll,通过底层系统事件模拟人类行为 - Playwright Input(可检测但便捷):
click、fill、type,基于 DOM 事件,适用于无反爬场景
显著优点
1. 极高隐蔽性:零 CDP 暴露、OS 级输入、持久指纹隔离,通过 CreepJS、BrowserScan、Pixelscan 等检测
2. 生产级部署:原生支持 Docker 集群、Redis Cookie 同步、HAProxy 粘性会话、请求队列机制
3. 灵活集成:同时提供 HTTP API、MCP Server、YAML Script 三种接口,覆盖交互式开发与自动化流水线
4. 状态持久:Cookie 跨实例同步、浏览器状态隔离、支持登录会话长期保持
5. 双模输入策略:开发者可根据目标站点的检测强度灵活切换隐蔽/便捷模式
潜在缺点与局限性
1. 资源开销大:每个浏览器实例需独立 Docker 容器,内存占用显著高于 curl 或 headless Chrome
2. 学习曲线陡峭:System Input 需掌握视口坐标计算、人机延迟调优、时区/IP 匹配等反检测细节
3. 单实例串行:未配置集群时请求强制排队,高并发场景需额外部署 HAProxy 与 Redis
4. 仅 Firefox 内核:Camoufox 基于 Gecko,某些 Chrome-only 特性或优化可能缺失
5. 维护依赖性:依赖社区维护的 Camoufox 与 Docker 镜像,版本滞后可能影响隐蔽性
适合人群
- 数据采集团队:需要稳定绕过企业级反爬系统的爬虫工程师
- 安全研究员:浏览器指纹检测、自动化对抗技术的研究者
- QA/DevOps:需要模拟真实用户行为的端到端测试场景
- MCP 生态用户:希望将浏览器能力接入 AI Agent 工作流的开发者
常规风险
- 法律合规:明确禁止用于未授权数据采集、账户滥用、自动化攻击等违法场景
- 服务条款冲突:即使技术绕过成功,也可能违反目标站点的 ToS
- 指纹关联:持久指纹若被标记,可能导致整批实例被关联封禁
- 资源滥用:集群模式下的 Redis、HAProxy 配置不当可能导致状态泄漏或请求风暴