核心用法
youtube-data 技能通过 TranscriptAPI.com 提供 YouTube 数据的结构化访问,是 Google YouTube Data API 的轻量替代方案。核心能力覆盖四大场景:
1. 视频数据提取 — 获取完整字幕(带时间戳)+ 元数据(标题、作者、缩略图),单次消耗 1 credit
2. 全局搜索 — 按关键词搜索视频或频道,返回视频 ID、频道信息、观看量、字幕可用状态等
3. 频道数据 — 支持 @handle/UC...ID/URL 三种输入格式,可解析频道 ID(免费)、获取最新 15 条视频(免费)、遍历全部视频(分页,1 credit/页)、频道内搜索(1 credit)
4. 播放列表 — 提取列表元数据及视频列表,分页获取(1 credit/页)
认证流程极简:用户提供邮箱 → 接收 6 位 OTP → 自动写入多环境配置文件(~/.transcriptapi、~/.zshenv、~/.openclaw/openclaw.json 等),实现跨 Shell、跨会话的免手动认证。
显著优点
- 零 Google 依赖:无需 GCP 项目、OAuth 2.0 流程、每日配额焦虑
- 成本透明:免费 tier 100 credits,单价统一 1 credit/次(除明确标注免费端点)
- 多环境持久化:自动向 8+ 个配置文件写入 API key,备份原文件(
.bak),降低重复配置成本 - 输入灵活:频道端点原生支持 handle/URL/ID 混用,无需前置解析
- OpenClaw 原生集成:配置文件更新
enabled: true,支持后台自主调用
潜在缺点与局限性
- 商业服务依赖:核心数据来源于第三方服务 TranscriptAPI,非官方 YouTube API,存在服务持续性风险
- 信用额度硬限制:免费 100 credits 耗尽后需付费,无「仅降速」模式;402 错误直接中断
- 功能边界:不支持评论抓取、实时直播数据、视频上传/修改等写操作
- 速率限制:300 req/min 对高频批量抓取仍可能构成瓶颈
- Node.js 依赖:认证脚本需本地 Node 环境,纯容器/受限环境可能受阻
适合人群
- 研究者/分析师:需批量获取视频字幕进行 NLP 分析、内容审计
- 内容创作者:监控竞品频道、整理播放列表元数据
- 自动化工作流开发者:构建无需人工介入的 YouTube 数据处理 pipeline
- 对 Google API 配额敏感的小型团队
常规风险
- API key 泄露风险:明文写入
~/.transcriptapi(mode 0600)及多 shell 配置文件,多用户系统需确保主目录权限 - 服务单点故障:TranscriptAPI 服务中断将直接影响全部功能,无 fallback 机制
- 合规边界:大规模抓取需自行评估 YouTube ToS 及目标地区数据法规
- 自动文件修改:脚本会修改
.zshenv、.bashrc等关键配置文件,虽备份但仍建议版本控制追踪