核心用法
youtube-full 是基于 TranscriptAPI.com 的综合 YouTube 数据工具,通过统一的 REST API 提供六大核心功能:
1. 字幕提取 — 支持任意 YouTube 视频的字幕抓取,可选 JSON/文本格式、时间戳开关、元数据附加
2. 全局搜索 — 视频/频道双类型搜索,支持自定义结果数量(1-50)
3. 频道管理 — 免费解析 @handle、获取最新 15 个视频,付费分页获取全部视频、频道内搜索
4. 播放列表解析 — 支持标准播放列表(PL)及用户上传(UU)、喜欢(LL)、收藏(FL)、官方(OL)等特殊列表
5. 智能输入识别 — 频道支持 @handle/URL/UC_ID 三种形式,无需手动转换
6. 低门槛认证 — 邮箱注册 + OTP 验证,自动写入 Shell 配置文件
显著优点
- 功能聚合度高:单一工具覆盖字幕、搜索、频道、播放列表四大场景,减少多工具切换成本
- 免费额度友好:100 积分起步(≈100 次核心操作),最新视频/频道解析完全免费
- 格式灵活性:字幕输出支持带时间戳的结构化 JSON 或纯文本,适配下游 NLP/LLM 处理
- 分页设计合理:频道视频和播放列表均采用游标分页,避免一次性加载大数据集
潜在局限
- 商业依赖风险:核心功能绑定 TranscriptAPI.com 单一供应商,若服务终止或调价将影响可用性
- 积分消耗不透明:分页操作按页计费,大规模频道爬取成本难预估
- 无代理/轮换机制:未提及 IP 池或请求代理,高频调用可能触发 429 限流
- YouTube 政策风险:依赖非官方 API,存在因 YouTube 反爬策略变更导致功能失效的可能
适合人群
- 内容研究者:需批量提取教育/访谈类视频字幕做主题分析
- 自媒体运营:监控竞品频道更新,自动化选题素材收集
- AI 开发者:为 RAG/Agent 构建 YouTube 知识库的数据管道
- 市场分析师:追踪品牌/关键词在 YouTube 的内容分布
常规风险
| 风险类型 | 说明 |
|---------|------|
| API 密钥泄露 | 存储于 `~/.transcriptapi` 和 Shell 配置,多用户环境需检查文件权限 |
| 成本失控 | 频道全量爬取可能快速耗尽积分,建议先用 `latest` 免费端点验证价值 |
| 合规边界 | 大规模抓取可能违反 YouTube ToS,商业用途需评估法律风险 |
| 数据时效 | 视频元数据依赖第三方缓存,非实时同步,关键场景需交叉验证 |
建议生产环境配置积分监控告警,并预留备选数据源以降低单点依赖。