核心用法
Smooth Browser 是面向 AI 代理的命令行浏览器工具,核心工作流包含四个步骤:创建可选的持久化 Profile(用于保存登录态和 Cookie)、启动浏览器会话(获取 session-id)、执行自然语言任务、最后关闭会话释放资源。支持通过 smooth run 执行复杂交互任务,或通过 smooth extract 进行高效结构化数据抓取,还可利用 smooth evaluate-js 直接执行 JavaScript。
显著优点
1. AI 原生设计:任务描述使用自然语言,无需编写 XPath 或 Selenium 代码,大幅降低自动化门槛
2. 会话持久化:Profile 机制可保存登录态,避免重复认证,适合需要长期维护的自动化场景
3. 灵活输出格式:支持 JSON Schema 定义结构化输出,便于与下游系统集成
4. 人机协作能力:live-view 功能允许在 CAPTCHA、2FA 等场景下无缝切换人工干预
5. 并发与扩展:支持多会话并行,可配合用户计划升级提升并发能力
潜在局限
- 成本依赖:基于 API 调用计费,高频或长会话场景可能产生较高费用
- 网络稳定性:依赖 Smooth.sh 云服务,离线环境不可用
- 代理限制:默认启用内置代理,部分网站可能拦截,需手动禁用
- 单任务单标签:会话内无法多标签操作,复杂并行需拆分会话
- 黑盒执行:Agent 决策过程不可完全控制,偶发任务偏离预期
适合人群
- 需要自动化网页操作的开发者与数据分析师
- 构建 AI Agent 工作流的技术团队
- 需定期抓取数据但无前端开发背景的业务人员
- 需要维护多个网站登录态的自动化运维场景
常规风险
1. 账户安全:Profile 持久化 Cookie 可能包含敏感凭证,需妥善保管 profile-id
2. 服务可用性:第三方 SaaS 依赖,存在服务中断或定价变更风险
3. 合规风险:大规模抓取需遵守目标网站的 robots.txt 及服务条款
4. API 密钥泄露:smooth config 配置的密钥需避免暴露在日志或代码仓库中