Instagram Scraper

📸 网红发现与数据采集利器

data-collection榜 #1

Instagram 资料爬取工具,支持按地理位置和分类发现网红账号,自动提取粉丝数、互动数据及媒体资源,适合营销调研与达人挖掘。

收藏
14k
安装
3.1k
版本
1.0.3
CLS 安全扫描中
预计需要 3 分钟...

使用说明

功能概述

Instagram Profile Scraper 是一款基于浏览器的 Instagram 账号发现与数据采集工具,采用「发现-抓取」两阶段架构,专为网红营销、市场调研及竞品分析场景设计。

核心用法

第一阶段:Profile Discovery(账号发现)

  • 通过 Google Custom Search API 按地理位置(如 Miami、New York)和行业分类(如 fitness、beauty、fashion)检索公开 Instagram 账号
  • 生成待抓取队列,支持批量任务管理

第二阶段:Browser Scraping(浏览器抓取)

  • 基于 Chromium 的全浏览器模拟环境,绕过反爬虫机制
  • 集成浏览器指纹伪装、人类行为模拟及隐身脚本
  • 提取完整资料:用户名、简介、粉丝/关注数、帖子数量、认证状态、分级标签(nano/micro/mid/macro/mega)
  • 下载缩略图(Profile + 最新 6 条内容封面)
  • 采集单帖互动数据(点赞、评论数)

显著优点

| 优势 | 说明 |
|------|------|
| 反检测能力强 | 指纹模拟 + 行为随机化,降低封号风险 |
| 智能过滤 | 自动跳过私密账号、低粉账号(<1000 可配置)、空号、已采集账号 |
| 断点续传 | 支持中断后恢复,适合大规模任务 |
| 结构化输出 | JSON/CSV 双格式,含本地缩略图路径,便于下游分析 |
| 分级体系 | 内置五档网红分级标准(nano 到 mega),快速筛选合作对象 |

潜在局限与风险

技术局限

  • 依赖 Google API 配额,免费 tier 每日限制 100 次查询
  • 需要有效 Instagram 账号登录,存在账号被封可能
  • 无法抓取私密账号内容(仅元数据)
  • 缩略图下载增加存储与带宽消耗

合规与法律风险

  • ToS 违规:违反 Instagram 服务条款第 4 条(禁止自动化数据收集)
  • GDPR/CCPA:采集欧盟/加州用户数据需明确法律依据
  • 肖像权:下载的用户头像与内容缩略图涉及第三方知识产权
  • 平台对抗:Meta 持续更新反爬策略,工具有效性可能衰减

适合人群

  • 跨境电商品牌方(寻找海外网红合作)
  • MCN 机构与达人经纪人
  • 市场研究分析师(竞品账号监测)
  • 社交媒体运营人员(行业趋势洞察)

常规风险控制建议

1. 账号隔离:使用独立 Instagram 小号,避免主号关联
2. 速率控制:拉长请求间隔,分散在闲时执行

3. 数据最小化:仅采集公开必要字段,本地存储加密

4. 合规审查:采集前确认目标账号所在司法辖区的数据保护法规

Instagram Scraper 内容

手动下载zip · 2.3 kB
SKILL.mdtext/markdown
请选择文件