nova-act

🌐 AI驱动的智能浏览器自动化专家

🥥37总安装量 14评分人数 17
100% 的用户推荐

基于 Amazon Nova Act 技术,通过自然语言实现浏览器自动化,支持航班搜索、数据提取等任务,大幅降低网页操作技术门槛。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 无危险函数(eval/exec)或注入漏洞,代码安全规范,依赖版本锁定
  • ✅ 完善的输入验证机制(fire + Pydantic),错误处理不暴露敏感信息
  • ✅ 无动态代码加载,依赖均为知名开源库(nova-act、Playwright)
  • ⚠️ 需配置 NOVA_ACT_API_KEY,任务数据将发送至 Amazon Nova Act API 处理
  • ⚠️ 浏览器自动化会访问外部网站,请在受信任的网络环境下使用

使用说明

Nova Act Browser Automation 是一款基于 Amazon Nova Act 技术的 AI 驱动浏览器自动化工具,允许用户通过自然语言指令控制浏览器执行复杂任务,无需编写繁琐的自动化脚本即可实现网页交互、数据提取和表单填写等操作。

该 Skill 的核心用法围绕两个主要 API 展开:nova.act() 用于执行浏览器操作(点击、输入、滚动、导航),nova.act_get() 用于结构化数据提取。用户通过自然语言描述任务,如"搜索从 SFO 到 NYC 的航班并返回前三个最便宜的选项",系统会自动解析并执行相应操作。Skill 提供了预置的 runner 脚本用于快速执行简单任务,同时支持用户编写自定义 Python 脚本处理复杂多步骤工作流。执行环境使用 uv run 进行依赖隔离,确保环境干净可控。

显著优点包括:自然语言交互大幅降低了浏览器自动化的技术门槛,非开发者也能快速上手;支持 Pydantic 模型的结构化数据提取,可直接将网页数据转换为 Python 对象;基于 Playwright 构建,具备强大的浏览器控制能力和稳定性;支持截图验证功能,便于调试和结果确认;通过上下文管理器维护会话状态,多步骤操作可在单个 act() 调用中完成,保持逻辑连贯性。

潜在局限包括:作为 T3 来源(个人开发者维护),长期维护稳定性存在不确定性;核心功能依赖 Amazon Nova Act 云服务,必须配置 API Key 且受网络条件制约;AI 对相对日期(如"下周一")理解能力有限,需用户预先转换为具体日期;需要本地安装 Chrome 浏览器或配置 headless 模式,对运行环境有一定要求。

适合目标群体包括:数据分析师(定期抓取网页报表、价格监控)、QA 测试人员(自动化前端测试流程)、运营人员(批量表单填写、信息录入)、研究人员(文献检索、数据收集)以及任何需要自动化网页重复操作的知识工作者。

使用风险主要包括:所有操作数据需发送至 Amazon Nova Act API 处理,存在数据隐私风险,不适合处理敏感个人信息;依赖外部 API 服务的可用性,存在网络延迟或服务中断风险;需要正确配置 NOVA_ACT_API_KEY 环境变量,密钥管理不当可能导致未授权使用;浏览器自动化可能被某些网站视为机器人行为,存在访问限制风险。

nova-act 内容

文件夹图标scripts文件夹
手动下载zip · 3.8 kB
nova_act_runner.pytext/plain
请选择文件