核心用法
Smooth Browser 是一款专为 AI Agent 设计的浏览器自动化工具,通过自然语言指令即可操控网页。核心工作流包括:创建持久化 Profile(保存登录态)→ 启动会话 → 用自然语言执行任务 → 关闭会话。支持 run(智能任务)、extract(高效数据提取)、evaluate-js(执行JS)三种主要交互模式。
显著优点
- 自然语言驱动:无需编写复杂选择器或脚本,用人类语言描述任务即可
- 持久化会话:Profile 机制保存 cookies 和登录状态,避免重复认证
- 结构化输出:通过 JSON Schema 直接获取类型化数据,便于下游处理
- 人机协作:
live-view支持 CAPTCHA 或 2FA 时人工介入 - 并行能力:支持多会话并发(受限于用户套餐),适合规模化任务
潜在缺点与局限
- 抽象层级敏感:任务描述过细("点击搜索")或过泛("找合适人选")都会导致效果下降,需要恰到好处的目标描述
- 单标签限制:所有任务在同一标签页执行,无法原生多标签并行
- 状态不继承:跨
run调用时 Agent 记忆不保留,需显式传递上下文 - 代理依赖:内置代理可能被部分网站拦截,需
--no-proxy切换 - 成本敏感:并发会话数和任务步数受套餐限制
适合人群
- 需要自动化 Web 数据采集的开发者/分析师
- 需批量操作多个 Web 账户的运营人员
- 构建 AI 工作流、需要将浏览器作为工具链一环的技术团队
- 不愿维护传统 Selenium/Playwright 脚本的用户
常规风险
- 账户安全:Profile 持久化登录态存在被盗用风险,建议敏感账户配合 2FA
- 数据隐私:网页内容需上传至 Smooth 服务端处理,涉及敏感数据的场景需评估合规性
- 网站封禁:自动化行为可能触发反爬机制,导致 IP 或账户被封
- 任务不可控:AI Agent 的决策过程存在不确定性,关键业务需人工复核结果