Amazon Product Search Api Skill

🌐 一键抓取亚马逊商品数据

通过 BrowserAct API 自动化抓取亚马逊搜索结果,提取结构化商品数据(价格、评分、销量等),支持多语言与品牌过滤,无验证码、无 IP 限制。

收藏
8.6k
安装
3k
版本
0.1.2
CLS 安全性认证2026-05-15
点击查看完整报告 >

使用说明

核心用法

Amazon Product Search API Skill 是一款基于 BrowserAct 的自动化数据采集工具,专为亚马逊商品搜索场景设计。用户只需提供关键词、品牌筛选条件和抓取数量,即可一键获取结构化的商品列表数据。该技能采用预置浏览器工作流,绕过传统爬虫面临的验证码拦截和 IP 封禁问题。

典型调用方式

python -u ./scripts/amazon_product_search_api.py "wireless earbuds" "Sony" 50 "en"

参数配置灵活:支持 8 种语言区域(en/de/fr/it/es/ja/zh-CN/zh-TW),可设定最大抓取数量(默认 50 条),并允许按品牌名精准过滤。

显著优点

1. 抗干扰能力强:内置机制规避 reCAPTCHA 验证和地理 IP 限制,无需代理池或人工介入
2. 输出稳定可靠:基于预设 DOM 解析规则,杜绝 LLM 生成式幻觉,数据字段固定可追溯

3. 成本效益突出:相比纯 AI 驱动的浏览器自动化方案,token 消耗显著降低

4. 字段覆盖全面:返回 10+ 核心字段,涵盖标题、URL、评分、评论数、预估月销量、现价/原价、配送信息、Best Seller 标识及库存状态

5. 执行状态可视:实时输出带时间戳的运行日志,便于监控长时任务进度

潜在局限

  • 依赖外部 API:需配置 BROWSERACT_API_KEY,服务可用性受 BrowserAct 平台稳定性制约
  • 数据源单一:仅覆盖亚马逊公开列表页信息,无法获取详情页深度数据(如完整图文描述、QA 问答)
  • 反爬策略风险:亚马逊页面结构变更可能导致解析规则失效,需技能维护方及时更新
  • 速率与配额限制:未明确披露 API 调用频次上限,大规模并发采集可能触发限流
  • 地域覆盖有限:语言选项虽多,但实际抓取结果仍受亚马逊站点库存和配送策略影响

适合人群

  • 电商运营与竞品分析师(监控价格、销量、Best Seller 动态)
  • 市场研究机构(快速构建品类数据集)
  • 跨境卖家(多站点选品与本地化需求分析)
  • 产品经理与数据科学家(验证市场假设、训练预测模型)

常规风险

  • 授权失效风险:API Key 过期或配置错误将直接导致任务中断,需人工重新授权
  • 数据时效性:抓取结果为某一时刻快照,价格波动和库存变化存在滞后
  • 合规边界:需确保采集行为符合亚马逊 robots.txt 及目标站点法律法规,大规模商用建议咨询法务
  • 隐私披露:预估销量等字段为平台算法推算值,非官方披露,分析时需注意置信度标注

安全解读

核心用法

Amazon Product Search Automation Skill 是一款基于 BrowserAct API 的自动化数据获取工具,专为电商市场研究、竞品分析和产品目录构建设计。用户只需提供搜索关键词、品牌过滤条件和数量上限,即可通过 Python 脚本一键获取结构化的 Amazon 产品数据。

该 Skill 的使用流程简洁:配置 BROWSERACT_API_KEY 环境变量后,执行 ./scripts/amazon_product_search_api.py 并传入关键词、品牌、数量和语言参数(如 python -u ./scripts/amazon_product_search_api.py "wireless earbuds" "Sony" 50 "en")。脚本通过 BrowserAct 的托管浏览器服务访问 Amazon,自动翻页抓取指定数量的产品,并输出包含标题、URL、评分、评论数、月销量、价格、配送信息、Best Seller 标识和库存状态等 11 个字段的结构化数据。

显著优点

1. 零反爬负担:无需处理 reCAPTCHA、IP 封锁或地理限制,BrowserAct 托管服务已解决这些技术难点
2. 数据精准可靠:预设工作流避免 AI 生成式幻觉,确保数据直接来源于 Amazon 页面

3. 成本效益突出:相比高 Token 消耗的纯 AI 浏览器自动化方案,API 调用成本显著降低

4. 多语言本地化:支持英、德、法、意、西、日、简中、繁中 8 种语言,便于区域市场分析

5. 实时状态监控:脚本持续输出带时间戳的状态日志,任务进度透明可查

潜在缺点与局限性

1. 第三方服务依赖:核心功能完全依赖 BrowserAct 服务商,若其服务中断或政策变更,Skill 将失效
2. 个人开发者维护:T3 来源可信度,长期维护能力和更新频率存在不确定性

3. 搜索数据外发:关键词、品牌偏好等需发送至 BrowserAct 服务器,敏感商业信息存在泄露风险

4. 请求超时未设置:当前代码缺乏超时参数,网络异常时可能长时间阻塞

5. 无响应结构验证:API 返回数据直接解析,未校验字段完整性,存在解析失败风险

适合人群

  • 电商卖家和市场研究人员:监控竞品价格、销量和 Best Seller 动态
  • 跨境电商运营:分析多语言站点的本地化产品布局和定价策略
  • 数据分析师和开发者:批量构建 Amazon 产品数据集,用于机器学习或商业智能
  • 中小团队和个人创业者:无技术能力自建爬虫系统,需要即拿即用的数据方案

常规风险

1. API Key 安全风险:密钥通过环境变量管理,需确保不在日志或版本控制中泄露
2. 服务商信誉风险:BrowserAct 作为第三方代理,可能记录搜索行为或存在数据滥用可能

3. 数据时效性风险:抓取数据为时点快照,价格和库存信息变化快,需配合定期监控

4. 合规边界风险:需遵守 Amazon 服务条款和当地数据保护法规,大规模抓取可能触发平台限制

5. 单次重试限制:脚本仅自动重试一次,网络波动严重时可能任务失败

Amazon Product Search Api Skill 内容

scripts文件夹
手动下载zip · 4.8 kB
amazon_product_search_api.pytext/plain
请选择文件