使用说明

核心用法

Captions技能通过TranscriptAPI.com接口提取YouTube视频的隐藏字幕(CC)和自动字幕。用户需提供YouTube视频URL或ID，可配置输出格式（JSON结构化/纯文本）、是否包含时间戳、是否返回视频元数据。

典型工作流程：
1. 检查环境变量TRANSCRIPT_API_KEY，未设置时引导用户完成注册（邮箱+OTP验证）
2. 调用GET /api/v2/youtube/transcript 获取字幕数据
3. 根据场景返回JSON格式（带时间戳，适合同步显示）或纯文本格式（适合阅读）

显著优点

无障碍优先：明确标注为聋人/听障人士(HoH)设计，支持精确时间同步
多语言支持：可提取视频可用的任意语言字幕
低成本入门：100免费积分/月，无信用卡门槛，适合轻度用户
灵活输出：JSON格式便于程序化解析，text格式便于人工阅读
元数据丰富：可选返回标题、作者、缩略图等辅助信息

潜在缺点与局限性

商业依赖：核心功能完全依赖第三方服务TranscriptAPI.com，无本地/开源替代方案
配额限制：免费档仅100积分（=100次请求），高频使用需付费
覆盖盲区：部分视频无字幕或禁用CC（返回404错误）
网络依赖：API超时(408)需重试，稳定性受第三方服务影响
注册摩擦：需邮箱验证+OTP，自动化场景难以完全无感配置

适合人群

聋人/听障用户获取视频可访问性支持
研究人员、记者引用视频原话内容
翻译工作者获取待翻译文本
内容创作者进行竞品字幕分析

常规风险

隐私泄露：邮箱和密码在CLI脚本中传递，虽有--json输出但历史记录可能留存敏感信息
API密钥管理：脚本自动保存密钥到环境，多用户共享机器时存在越权访问风险
服务中断：第三方服务故障或下线将导致技能完全失效
版权敏感：提取的字幕可能受原视频版权保护，商用需谨慎

accessibility youtube transcription subtitles api-integration i18n hearing-impaired

captions 内容

暂无文件树

手动下载zip · 7.7 kB

contentapplication/octet-stream

请选择文件