使用说明

核心用法

TubeScribe 是一个完全本地运行的 YouTube 视频处理技能，用户只需提供视频链接即可自动生成结构化文档和音频摘要。工作流程分为六个步骤：提取原始字幕数据、调用子代理进行智能分析与格式化、转换为 HTML/DOCX/Markdown 文档、可选生成 TTS 音频摘要、清理临时文件、打开输出结果。支持批量处理和队列管理，可处理多视频串联任务。

显著优点

1. 完全隐私保护：所有处理在本地完成，无需 API 密钥，视频内容不会上传至第三方服务器
2. 零成本使用：开源免费，无订阅费用或使用次数限制
3. 智能内容处理：自动识别多说话人（访谈/播客场景）、生成可点击时间戳、提取热门评论 sentiment
4. 灵活输出格式：支持专业 DOCX（需 pandoc）、自包含 HTML 或纯 Markdown
5. 音频摘要功能：集成 Kokoro TTS 或系统内置语音合成，适合通勤收听
6. 完善的错误处理：对私享视频、地区限制、无字幕、直播中等情况提供明确报错

潜在局限

1. 依赖外部工具链：需要单独安装 summarize CLI、可选组件 pandoc/ffmpeg/yt-dlp，首次配置有一定门槛
2. 字幕依赖性：无法为无字幕视频生成转录（不支持语音识别）
3. 说话人识别启发式：基于语境猜测而非声纹识别，复杂多轮对话可能误判
4. 平台限制：主要面向 macOS（使用 brew install 和 open 命令），跨平台支持未明确
5. 长视频处理成本：超过30分钟视频需延长子代理超时时间，消耗更多本地算力

适合人群

研究人员、记者、学生：需要系统整理访谈、讲座、纪录片内容
播客听众：希望快速浏览内容并生成随身音频摘要
内容创作者：批量提取视频脚本、分析评论区反馈
隐私敏感用户：拒绝将观看历史或视频内容提交云端服务

常规风险

版权合规：转录受版权保护的内容可能违反 YouTube 服务条款或当地法律
字幕准确性：自动生成的 YouTube 字幕可能存在错误，影响摘要质量
本地存储：临时文件和输出文档占用磁盘空间，需定期清理
依赖维护：yt-dlp 等工具需跟随 YouTube 反爬虫机制更新，可能偶发失效

安全解读

核心用法

TubeScribe 是一款专为 YouTube 内容设计的本地转录与摘要工具。用户只需提供视频链接，系统即可自动完成：提取视频元数据与字幕、识别多位说话人、生成结构化摘要文档、导出为 HTML/DOCX/Markdown 格式，并可选择性生成音频摘要。整个流程通过 Python 脚本驱动，支持子代理深度处理长视频内容。

核心命令为 python skills/tubescribe/scripts/tubescribe.py "YOUTUBE_URL"，执行后会生成包含完整转录、关键引用、可点击时间戳及观众评论分析的格式化文档。

显著优点

完全本地化与隐私优先：无需订阅、无需 API 密钥、无数据上传，所有处理在本地完成，符合 GDPR 数据最小化原则。支持离线运行，适合对隐私敏感的用户。

多维度输出能力：不仅提供文字转录，还集成 Kokoro TTS 高质量语音合成，可将摘要转换为 MP3/WAV 音频。文档格式灵活，满足编辑、存档、分享等不同场景。

智能内容理解：自动识别视频中的多位说话人（适用于访谈、播客），提取关键引用并生成带超链接的时间戳，观众评论分析功能可快速把握社群反馈。

零配置开箱即用：依赖 Homebrew 生态一键安装，提供详细的配置系统（~/.tubescribe/config.json）供进阶用户自定义，同时支持队列批处理提升效率。

潜在缺点与局限性

外部依赖较重：核心功能依赖 summarize CLI、可选依赖包括 pandoc、ffmpeg、yt-dlp 及 Kokoro TTS，首次配置需安装多个二进制工具，跨平台兼容性（尤其 Windows）未明确说明。

网络与内容限制：依赖 YouTube 字幕可用性，无字幕视频无法处理；受 YouTube 区域限制、年龄验证、私人视频等约束；无法处理直播流。

说话人识别准确率：虽声称智能识别，但自动区分说话人依赖启发式规则（问题/回答模式、说话时长等），复杂场景（多人同时说话、背景嘈杂）可能出现误判。

长视频处理开销：超过 30 分钟的视频需延长子代理超时时间至 900 秒，本地 LLM 处理大文本对硬件有一定要求。

适合人群

研究者与学者：需要归档、引用 YouTube 学术讲座内容
内容创作者与编辑：快速提炼访谈素材、生成节目笔记
播客听众：将视频访谈转为可检索文字稿及便携音频摘要
隐私敏感用户：拒绝云端转录服务的数据收集行为
效率工具爱好者：偏好命令行工作流与自动化批处理

常规风险

依赖维护风险：yt-dlp 等工具因 YouTube 平台变动需频繁更新，Skill 未内置自动更新机制，过时依赖可能导致功能失效。

下载安全建议：当前版本从 GitHub 下载外部二进制时未验证 SHA256 校验和（建议未来版本添加），用户需确保网络环境可信。

数据残留风险：虽支持临时文件清理，但用户需确认配置中 cleanup_temp_files 已启用，避免 /tmp 目录残留视频元数据。

youtube transcription summarization tts local-first privacy content-creation research podcast video-analysis

TubeScribe 内容

scripts文件夹

手动下载zip · 30.9 kB

config.pytext/plain

请选择文件