核心用法
yt-digest 是一款专为 Claude Code 设计的 YouTube 视频信息提取 Skill,通过命令行接口提供四种核心功能:
1. 转录提取 ( (transcript):获取带时间戳的完整视频字幕,支持自动生成字幕
2. 智能摘要 ( (summary):提取视频元数据(标题、频道、时长)并生成内容概述
3. 关键时刻 ( (chapters):提取视频章节或自动生成关键时间点标记
4. 综合分析 ( (analyze):整合上述所有信息,输出完整的视频分析报告
使用方式简洁直观,只需提供 YouTube 链接即可自动处理,支持多种 URL 格式(标准 watch 链接、短链接 youtu.be、嵌入链接等)。
显著优点
- 零配置上手:无需申请 YouTube API Key,直接处理公开视频
- 多格式兼容:智能识别各类 YouTube URL 格式,也支持直接输入 11 位视频 ID
- 结构化输出:结果以清晰的 Markdown 格式呈现,包含 emoji 图标和层级标题,便于阅读
- 临时文件安全:使用系统临时目录存储中间文件,带自动清理机制
- 依赖成熟可靠:基于 yt-dlp(数百万用户使用的开源工具)和 youtube-transcript 社区库
- 音频扩展能力:可通过 sag skill 将摘要转换为语音输出
潜在缺点与局限性
- 仅支持公开视频:无法处理私密、会员专属或年龄限制视频
- 字幕质量依赖源:自动生成字幕可能存在识别错误,非英语视频支持有限
- 外部工具依赖:必须预先安装 yt-dlp,Windows 环境配置可能较复杂
- 网络稳定性要求:YouTube 反爬机制可能导致偶发获取失败
- 无批量处理能力:单次仅处理单个视频,不适合大规模视频分析场景
- 语言支持受限:当前版本主要优化英语内容,多语言字幕提取能力一般
适合的目标群体
- 内容创作者与研究者:快速获取视频素材的文本内容用于引用分析
- 学生与终身学习者:将长视频课程转换为可搜索的文本笔记
- 产品经理与市场分析师:批量了解竞品视频内容结构
- 无障碍需求用户:获取视频文字版以辅助理解
- 播客与媒体工作者:提取访谈内容制作文字稿
使用风险
- 命令注入隐患:当前版本使用字符串拼接执行 yt-dlp 命令,虽经 URL 验证仍存在理论风险
- yt-dlp 版本依赖:工具功能受 yt-dlp 更新影响,YouTube 页面结构变更时需同步更新
- 临时目录冲突:极端并发场景下
Date.now()()文件名可能冲突 - 网络请求可追溯:使用 yt-dlp 访问 YouTube 会留下可识别的请求指纹
- 版权合规注意:提取的转录内容受原视频版权保护,商用需获得授权