Agent Browser Core

AI原生的CLI浏览器自动化引擎

browser-automation榜 #3

面向AI代理的CLI浏览器自动化工具,支持快照引用与结构化命令,Rust核心+Node.js回退实现高性能确定性Web自动化。

收藏
38.1k
安装
10.1k
版本
1.0.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

Agent Browser Core 综合评估

核心用法

Agent Browser Core 是一个专为AI代理设计的命令行浏览器自动化工具,采用Rust核心实现并配备Node.js回退机制。其核心工作模式围绕快照-引用-操作循环:通过snapshot命令获取当前页面的结构化表示(包含元素引用refs),AI基于快照决策后,使用act命令通过refs执行精确操作,完成后再次快照验证状态变化。

关键命令模式包括:

  • agent-browser snapshot [url] --json 获取机器可解析的页面状态
  • agent-browser act <ref> <action> 通过元素引用执行点击、输入等操作
  • agent-browser waitcheck-load-state 用于同步等待DOM稳定
  • --json 标志确保输出可被脚本和AI流水线消费

显著优点

1. AI原生设计:专为LLM优化,JSON输出和refs系统消除传统DOM解析的模糊性
2. 双引擎性能:Rust核心提供亚秒级响应,Node.js回退确保兼容性

3. 确定性引用:基于稳定标识的refs系统,避免CSS选择器易碎问题

4. 资源隔离:会话和标签页独立管理,支持多工作流并行

5. 紧凑型快照:相比完整HTML,结构化快照大幅降低token消耗

局限性与风险

  • 非SDK架构:仅限CLI调用,无法深度嵌入自定义JS运行时
  • 媒体流限制:不支持大文件流式上传或复杂媒体处理管道
  • 状态依赖:refs在DOM剧变后可能失效,需重新快照
  • 认证复杂性:多步骤登录需显式会话策略管理

适合人群

  • 构建AI代理系统的开发者
  • 需要可靠Web自动化但无需浏览器扩展的场景
  • 追求低延迟、高确定性自动化的DevOps/MLOps团队
  • 令牌预算敏感的AI应用(紧凑快照优势)

常规风险

| 风险类型 | 说明 | 缓解措施 |
|---------|------|---------|
| 凭证泄露 | CLI历史或日志暴露token | 使用环境变量注入,避免命令行明文 |
| 文件访问滥用 | `--allow-file-access` 扩大攻击面 | 默认禁用,按需显式启用 |
| 资源泄漏 | 未关闭标签页/会话导致内存累积 | 工作流终章必须执行清理命令 |
| 竞态条件 | DOM未稳定时执行操作 | 强制使用`wait`与`check-load-state`前置检查 |

Agent Browser Core 内容

暂无文件树

手动下载zip · 3.6 kB
contentapplication/octet-stream
请选择文件