核心用法
Clawbrowser 是一个基于 Playwright CLI 的浏览器自动化工具,专为 agent 设计,提供轻量级的浏览器控制能力。核心工作流程遵循"打开→快照→交互→验证"的循环模式:
1. 启动与配置:通过 npm install -g @playwright/cli 安装,使用 playwright-cli.json 配置浏览器参数、视口、超时和输出目录
2. 页面交互:open <url> 加载页面,snapshot 生成元素引用(e1, e2...),然后通过 click、fill、type 等命令操作元素
3. 状态管理:--session=<name> 实现会话隔离,持久化 cookie、存储和标签页状态,支持 session-list、session-stop、session-restart 等管理命令
4. 证据捕获:screenshot、pdf、console、network 用于记录执行过程和调试
5. 录制追踪:tracing-start/stop 和 video-start/stop 支持操作回放和审计
显著优点
- 轻量高效:无需启动完整 MCP 浏览器,CLI 直接驱动,资源占用低
- 会话隔离:多会话机制确保工作流互不干扰,适合并发任务
- 配置灵活:JSON 配置文件 + 命令行覆盖,支持 headless/headed 切换、多浏览器选择(Chromium/Firefox/WebKit)
- 自文档化:
--help实时反映最新命令集,降低学习成本 - DevTools 级调试:内置 console、network 拦截、权限注入等高级能力
局限性与风险
- 元素引用易失效:DOM 变化后必须重新
snapshot,否则操作会失败 - CLI 依赖稳定性:依赖 Node.js 环境和 Playwright 二进制文件,首次安装较大
- 无视觉反馈(默认):headless 模式下难以直观排查问题,需主动截图
- 会话持久化风险:长期运行的会话可能积累敏感状态,需显式
session-delete清理
适合人群
- 需要快速原型验证的自动化开发者
- 在资源受限环境中运行的 agent 系统
- 熟悉命令行、偏好脚本化控制而非 GUI 自动化的工程师
常规风险控制
1. 敏感操作(登录、支付)前启用 tracing-start 留痕
2. 涉及凭证时优先使用 --isolated 临时会话,避免持久化
3. 定期执行 session-stop-all + session-delete 清理残留状态
4. 生产环境建议固定 Playwright 版本,避免 latest 带来的兼容性风险