youtube-data

📊 零配额 YouTube 数据一键抓取

Data & Research榜 #2

零门槛 YouTube 数据获取工具,无需 Google API 配额即可提取视频字幕、元数据、频道信息和播放列表,适合自动化研究场景。

收藏
10.9k
安装
3.3k
版本
1.4.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

youtube-data 技能通过 TranscriptAPI.com 提供 YouTube 数据的结构化访问,是 Google YouTube Data API 的轻量替代方案。核心能力覆盖四大场景:

1. 视频数据提取 — 获取完整字幕(带时间戳)+ 元数据(标题、作者、缩略图),单次消耗 1 credit
2. 全局搜索 — 按关键词搜索视频或频道,返回视频 ID、频道信息、观看量、字幕可用状态等

3. 频道数据 — 支持 @handle/UC...ID/URL 三种输入格式,可解析频道 ID(免费)、获取最新 15 条视频(免费)、遍历全部视频(分页,1 credit/页)、频道内搜索(1 credit)

4. 播放列表 — 提取列表元数据及视频列表,分页获取(1 credit/页)

认证流程极简:用户提供邮箱 → 接收 6 位 OTP → 自动写入多环境配置文件(~/.transcriptapi~/.zshenv~/.openclaw/openclaw.json 等),实现跨 Shell、跨会话的免手动认证。

显著优点

  • 零 Google 依赖:无需 GCP 项目、OAuth 2.0 流程、每日配额焦虑
  • 成本透明:免费 tier 100 credits,单价统一 1 credit/次(除明确标注免费端点)
  • 多环境持久化:自动向 8+ 个配置文件写入 API key,备份原文件(.bak),降低重复配置成本
  • 输入灵活:频道端点原生支持 handle/URL/ID 混用,无需前置解析
  • OpenClaw 原生集成:配置文件更新 enabled: true,支持后台自主调用

潜在缺点与局限性

  • 商业服务依赖:核心数据来源于第三方服务 TranscriptAPI,非官方 YouTube API,存在服务持续性风险
  • 信用额度硬限制:免费 100 credits 耗尽后需付费,无「仅降速」模式;402 错误直接中断
  • 功能边界:不支持评论抓取、实时直播数据、视频上传/修改等写操作
  • 速率限制:300 req/min 对高频批量抓取仍可能构成瓶颈
  • Node.js 依赖:认证脚本需本地 Node 环境,纯容器/受限环境可能受阻

适合人群

  • 研究者/分析师:需批量获取视频字幕进行 NLP 分析、内容审计
  • 内容创作者:监控竞品频道、整理播放列表元数据
  • 自动化工作流开发者:构建无需人工介入的 YouTube 数据处理 pipeline
  • 对 Google API 配额敏感的小型团队

常规风险

  • API key 泄露风险:明文写入 ~/.transcriptapi(mode 0600)及多 shell 配置文件,多用户系统需确保主目录权限
  • 服务单点故障:TranscriptAPI 服务中断将直接影响全部功能,无 fallback 机制
  • 合规边界:大规模抓取需自行评估 YouTube ToS 及目标地区数据法规
  • 自动文件修改:脚本会修改 .zshenv.bashrc 等关键配置文件,虽备份但仍建议版本控制追踪

youtube-data 内容

暂无文件树

手动下载zip · 8.8 kB
contentapplication/octet-stream
请选择文件