video-transcript

YouTube 视频秒转文字字幕

一键提取 YouTube 视频字幕,支持翻译、引用与智能摘要,处理速度快至秒级。

收藏
14.7k
安装
3.2k
版本
1.5.0
CLS 安全性认证2026-06-03
点击查看完整报告 >

使用说明

核心用法

video-transcript 是一款专用于 YouTube 视频内容文本化的轻量级 Skill。用户只需粘贴视频链接或 11 位视频 ID,即可通过 TranscriptAPI 服务获取完整字幕。支持两种输出格式:text(带时间戳的可读文本)和 json(结构化数据,适合精确引用片段)。可附加视频元数据(标题、频道、缩略图)增强上下文理解。

典型使用场景包括:

  • 快速获取外语视频内容并翻译
  • 提取讲座、访谈、播客的关键引用
  • 为长视频生成结构化摘要(Skill 内置建议:先总结要点,按需展开全文)
  • 处理 YouTube Shorts 短视频

显著优点

1. 零代码门槛:纯 Markdown 文档型设计,无需理解 API 调用细节,Agent 自动处理请求构造与认证
2. 格式灵活:JSON 格式保留精确到秒的时间戳,便于定位特定画面;纯文本格式适合直接阅读或二次编辑

3. 成本透明:免费 tier 含 100 credits,错误请求不扣费,个人使用完全充足

4. 合规友好:明确声明仅需 TRANSCRIPT_API_KEY 单一环境变量,无额外权限索取,符合数据最小化原则

潜在局限

  • 来源依赖单一:核心功能完全绑定 TranscriptAPI 服务,若该服务宕机或调整定价,Skill 即失效
  • 仅支持 YouTube:无法处理 TikTok、Bilibili、Vimeo 等其他平台视频
  • 字幕可用性限制:部分创作者关闭字幕或仅提供自动生成的低质量字幕,此时返回 404 错误
  • 无本地处理能力:必须联网,无法离线处理已下载的视频文件

适合人群

  • 内容创作者与编辑者(快速提取引用素材)
  • 学生与研究人员(课程、学术讲座笔记整理)
  • 多语言用户(外语视频学习、翻译辅助)
  • 信息工作者(播客、访谈内容结构化归档)

常规风险

  • API 密钥泄露风险TRANSCRIPT_API_KEYsk_ 开头,若误提交到版本控制或分享给他人,可能被滥用消耗 credits
  • Cloudflare 拦截:未正确设置 User-Agent 头会导致 403/1010 错误,但该问题通常由 Agent 自动处理
  • 隐私边界:虽然 Skill 本身不存储数据,但 TranscriptAPI 作为中间服务会获知用户请求的视频 URL,对敏感内容需自行评估

安全解读

核心用法

Video Transcript Skill 是一个纯Markdown文档型工具,通过调用 TranscriptAPI.com 服务实现YouTube视频字幕提取。用户仅需提供视频链接或11位视频ID,即可获取带时间戳的完整转录文本。

调用方式

  • 基础转录:/api/v2/youtube/transcript?video_url=URL&format=text
  • 结构化数据:format=json 获取精确时间戳(用于精准引用)
  • 增强模式:send_metadata=true 同时获取视频标题、频道、缩略图等元数据

输出格式

  • 文本模式:[00:00:18] 字幕内容... 便于快速阅读
  • JSON模式:{text, start, duration} 对象数组,适合程序化分析

显著优点

| 维度 | 优势 |
|------|------|
| **零门槛** | 免费100 credits,无需信用卡,支持CLI自动注册 |
| **全平台** | 标准视频、Shorts、youtu.be短链、裸视频ID全兼容 |
| **灵活性** | 可选时间戳、元数据、双格式输出,适配摘要/引用/翻译多种场景 |
| **轻量化** | 纯文档型Skill,无本地依赖,无需额外运行时 |
| **成本控制** | 仅成功请求计费,错误不扣费,300 req/min 速率限制 |

潜在缺点与局限性

1. 服务依赖性:功能完全绑定TranscriptAPI.com,若该服务中断或变更条款,Skill立即失效
2. 来源可信度:维护者为个人开发者(T3级别),长期维护稳定性需持续观察

3. 平台限制:仅支持YouTube,不支持Bilibili、TikTok、本地视频文件等其他来源

4. 字幕前提:依赖视频本身有字幕/自动字幕,无配音视频或禁用CC的内容无法转录

5. 网络要求:必须保持互联网连接,不支持离线缓存或批量预处理

适合人群

  • 内容研究者:需要快速获取演讲、讲座、访谈的文字稿
  • 翻译工作者:获取原文本后进行多语言本地化
  • 媒体剪辑师:通过时间戳精准定位引用片段
  • 信息消费者:希望"阅读"而非"观看"视频内容
  • 无障碍需求用户:将视频音频转化为可读文本

常规风险

| 风险类型 | 说明 | 缓解建议 |
|----------|------|----------|
| API密钥泄露 | 硬编码密钥可能被意外提交到Git仓库 | 始终使用环境变量 `$TRANSCRIPT_API_KEY` |
| 403封禁 | 缺少User-Agent头触发Cloudflare拦截 | 确保发送 `User-Agent: YourAgent/1.0` |
| 额度耗尽 | 高频使用超出100免费credits | 关注402错误,及时在transcriptapi.com/billing充值 |
| 隐私顾虑 | 视频URL和API密钥传输至第三方服务器 | 避免处理敏感/私人视频内容 |
| 版权合规 | 提取的字幕可能受原视频版权保护 | 仅用于个人学习、引用评论等合理使用场景 |

video-transcript 内容

references文件夹
手动下载zip · 5.4 kB
auth-setup.mdtext/markdown
请选择文件