核心用法
Video Transcript Downloader 是一个 Node.js 封装工具,整合 youtube-transcript-plus 与 yt-dlp 双引擎,提供三类核心功能:
1. 智能转录提取
- 优先调用 YouTube 官方字幕 API(
youtube-transcript-plus) - 降级策略:自动 fallback 至
yt-dlp拉取外挂字幕并清洗 - 默认输出纯净段落文本(去除时间戳与音效标记
[Music]),可选--timestamps保留时间轴
2. 多媒体下载
download:视频下载,支持格式选择(--format 137+140)与无损 remux(--remux-video mp4)audio:纯音频提取subs:字幕文件独立下载
3. 格式诊断
formats子命令列出所有可用流(分辨率、编码、容器),便于精准选择
显著优点
| 维度 | 优势 |
|------|------|
| 覆盖度 | 继承 yt-dlp 的 1000+ 站点支持,不限于 YouTube |
| 输出质量 | 自动清洗为可读段落,优于原始 SRT/VTT 的机器格式 |
| 灵活性 | 支持 `--` 透传任意 yt-dlp 参数,高级用户可深度定制 |
| 降级容错 | 官方 API 失效时自动切换字幕抓取,提升成功率 |
潜在缺点与局限性
- 版权风险:工具本身中立,但下载受版权保护内容可能违反平台 ToS 及当地法律
- 依赖外部二进制:需本地安装
yt-dlp与ffmpeg,Windows 环境配置较复杂 - 非实时处理:转录为离线批处理,无实时语音转文字能力
- 中文支持参差:部分站点(如 Bilibili 非官方镜像)字幕提取稳定性不及 YouTube
适合人群
- 内容研究者:批量获取播客/讲座文字稿用于摘要与引用
- 媒体归档人员:构建本地可搜索的视频知识库
- 开发者/运维:调试 yt-dlp 格式选择或处理播放列表下载异常
常规风险
| 风险类型 | 说明 |
|---------|------|
| 法律合规 | 下载 DRM 保护或明确禁止缓存的内容可能面临 DMCA 等法律后果 |
| 账号安全 | 高频请求可能触发 YouTube 反爬虫机制,建议控制速率或配置 cookies |
| 供应链安全 | `yt-dlp` 更新频繁,需通过官方渠道(brew/pip)安装以避免恶意 fork |