yt-transcript

📜 一键提取视频字幕精华

基于 Supadata API 与 yt-dlp 双引擎的 YouTube 字幕提取工具,支持自动生成字幕解析,为内容研究者节省 10-30 分钟/视频的信息获取时间。

收藏
15.5k
安装
3.9k
版本
v1.0.0
CLS 安全性认证2026-04-30
点击查看完整报告 >

使用说明

核心用法

YouTube Transcript Extractor 是一款专注于视频字幕提取的实用工具,用户只需提供 YouTube 视频 URL 或视频 ID,即可快速获取纯文本格式的字幕内容。该技能采用双引擎架构:优先调用 Supadata API 实现秒级响应,当 API 不可用时自动降级至 yt-dlp 命令行工具,确保高可用性。输出结果已自动清理时间戳,直接呈现可读性强的纯文本,便于后续分析处理。

显著优点

双重保障机制是该技能的核心竞争力。Supadata API 提供商业化级别的稳定服务,而 yt-dlp 作为开源社区维护的成熟工具,能够处理各种边缘场景,包括无人工字幕时提取自动生成字幕的能力。这种设计显著提升了成功率,避免了单点故障。此外,工具对输入参数进行了完善的正则验证,错误处理机制成熟,用户体验友好。

潜在缺点与局限性

首先,该技能依赖第三方服务,Supadata API 需要配置密钥,且存在调用配额和成本考量;yt-dlp 则依赖 YouTube 页面结构的稳定性,官方调整可能导致解析失效。其次,Shell 脚本采用正则表达式解析 HTML,虽经安全审计无注入风险,但解析鲁棒性不及官方 SDK。最后,技能仅支持公开视频,私有视频、年龄限制内容或区域封锁视频无法获取字幕。

适合的目标群体

该技能特别适合内容创作者、研究人员、学生及知识工作者。对于需要快速消化大量视频信息的人群,如播客听众转文字稿、在线教育课程笔记整理、市场趋势视频分析等场景,能显著提升信息处理效率。同时,AI 应用开发者也可将其作为视频理解 pipeline 的前置组件。

使用风险

常规风险主要包括:网络依赖(需稳定连接 YouTube 服务器)、速率限制(高频调用可能触发平台限流)、依赖维护(youtube-captions-scraper 等社区包需关注安全更新)。建议用户控制请求频率,避免用于大规模自动化爬取,以防账号或 IP 受限。

安全解读

核心用法

YouTube Transcript Extraction 是一个专门用于提取YouTube视频字幕的实用工具,支持通过视频URL或ID直接获取完整文字稿。用户只需执行 /root/clawd/yt-transcript VIDEO_ID 即可获得干净、无时间戳的纯文本字幕。

该Skill采用双引擎回退机制:首选Supadata API进行快速提取(通常数秒内完成),若失败则自动降级至yt-dlp CLI工具。这种设计确保了高成功率和稳定性,即使面对没有人工字幕、仅有自动生成的视频也能正常工作。

显著优点

  • 高效省时:单次操作可节省观看10-30分钟视频的时间,直接获取核心内容
  • 输出简洁:自动清除时间戳,返回可直接用于AI分析或人工阅读的纯文本
  • 覆盖全面:支持所有带字幕的YouTube视频,包括自动生成字幕(auto-generated captions)
  • 来源可信:GitHub组织账号维护,代码开源透明,通过T2级可信认证
  • 网络受限安全:所有请求严格限定于youtube.com官方域名,无外泄风险

潜在缺点与局限性

  • 依赖第三方库:核心依赖youtube-captions-scraper、youtube-transcript、youtubei.js等非官方社区库,这些逆向工程工具可能因YouTube接口变更而失效
  • 页面结构依赖:备用Bash脚本通过正则解析YouTube页面HTML获取字幕链接,若页面结构更新可能导致提取失败
  • 无官方API保障:未使用YouTube官方Data API,长期稳定性依赖社区维护
  • 内容受限:仅能提取已启用字幕的视频,完全无字幕或禁用字幕的视频无法处理

适合人群

  • 内容研究者、媒体人、学生:需要快速浏览大量视频并提取关键信息
  • 知识管理用户:构建个人视频学习笔记系统
  • 自动化工作流构建者:将视频内容纳入AI摘要、问答或分析 pipeline
  • 多语言学习者:获取视频文字稿辅助语言学习

常规风险

  • 依赖安全风险:第三方npm包若被恶意劫持或出现未披露漏洞,可能影响本地环境
  • 功能失效风险:YouTube页面变更或API限制可能导致提取功能突然中断
  • 隐私合规:处理视频URL时需注意是否符合平台ToS,建议仅用于个人学习研究场景

安全等级说明

该Skill获得A级(82分)安全认证,静态与动态分析均通过,无危险函数调用、无硬编码密钥、网络行为受限明确。主要扣分项来自第三方依赖的维护风险,建议用户定期关注依赖更新状态。

yt-transcript 内容

scripts文件夹
手动下载zip · 7.4 kB
transcript.jstext/javascript
请选择文件