核心定位
stealthy-auto-browse 是一款面向高级反爬对抗场景设计的浏览器自动化技能,采用 Camoufox(Firefox 定制分支)作为浏览器引擎,彻底规避 Chrome DevTools Protocol 暴露的检测风险。其核心创新在于零 CDP 信号 + OS 级输入模拟:通过 PyAutoGUI 生成真实的操作系统级鼠标/键盘事件,使浏览器自身无法感知自动化痕迹,从而穿透 CreepJS、BrowserScan、Pixelscan 及 Cloudflare 等企业级防护体系。
显著优点
1. 对抗能力业界领先
- 完全消除 CDP 协议暴露(Firefox 基础架构无 CDP)
- OS 级输入事件无法被 JavaScript 行为分析检测
- 通过主流指纹扫描器测试(CreepJS、BrowserScan、Pixelscan)
- 支持持久化指纹与用户配置(
mount /userdata)
2. 双模式操作灵活
- System Input(隐形模式):
system_click、system_type、send_key等,模拟真实人类交互轨迹(贝塞尔曲线鼠标移动、抖动延迟、随机化打字间隔) - Playwright Input(快速模式):标准 DOM 操作,适合非对抗场景
3. 工程化功能完备
- Page Loader 机制:URL 触发自动化脚本,类似 Greasemonkey 服务端化
- Script Mode:YAML 驱动的一次性执行流程,无需 HTTP 服务
- 内置隐私扩展:uBlock Origin、LocalCDN、ClearURLs、Consent-O-Matic
- 网络日志捕获、多 Tab 管理、文件上传下载、对话框处理
4. 部署与集成友好
- 纯 Docker 容器化,单端口 HTTP API
- 内置 noVNC 实时可视化调试(5900 端口)
- 支持代理注入、时区匹配、自定义分辨率
潜在局限与风险
1. 性能与资源开销
- 需要完整 Xvfb 虚拟显示环境,内存占用显著高于 headless 模式
- 人类化模拟(鼠标轨迹、打字延迟)主动牺牲执行速度
- Docker 容器启动时间数秒级,不适合高频短时任务
2. 技术复杂度曲线陡峭
- 坐标系管理:viewport 坐标与 screen 坐标的偏移校准(
calibrate、window_offset) - 必须预先调用
get_interactive_elements获取精确坐标,无法直接复用 CSS Selector - 全屏/窗口状态切换后需重新校准,增加状态管理负担
3. 维护与生态风险
- 依赖 Camoufox 单一上游 fork,更新频率与 Firefox 主线同步存在滞后风险
- 开源项目(psyb0t/docker-stealthy-auto-browse)维护者为个人开发者,长期可持续性存疑
- 无官方商业支持,企业级 SLA 缺失
4. 合规与法律边界模糊
- 明确设计用于"actively fighting automation"站点的突破,可能触发服务条款违约
- 持久化指纹技术可绕过平台账户风控,存在滥用风险
适用人群
| 场景 | 推荐度 |
|------|--------|
| 数据采集工程师(反爬对抗场景) | ⭐⭐⭐⭐⭐ |
| 安全研究员/渗透测试人员 | ⭐⭐⭐⭐⭐ |
| 需要登录态保持的长期监控任务 | ⭐⭐⭐⭐⭐ |
| 简单静态页面爬取 | ⭐☆☆☆☆(过度设计)|
| 高频低延迟 API 测试 | ⭐☆☆☆☆(性能不匹配)|
| 合规敏感型企业生产环境 | ⭐⭐☆☆☆(需法律评估)|
常规风险提示
- IP/时区一致性:必须将容器
TZ与代理 IP 地理位置匹配,否则成为显著检测特征 - 指纹一致性:频繁更换指纹比固定指纹更易触发风控,建议持久化
profile卷 - 行为节奏控制:即使使用隐形模式,过于机械的执行间隔仍需
sleep或随机延迟模拟 - 资源泄漏:未关闭的 Tab、未清理的下载文件在长期使用中需监控
- 升级兼容性:Camoufox 版本升级可能导致指纹特征变化,需重新验证 stealth 效果