TubeScribe

🎬 YouTube 智能转录与摘要一键生成

本地运行的 YouTube 视频转录与摘要工具,支持说话人识别、多格式导出及音频摘要,100%免费离线使用

收藏
15.4k
安装
4.5k
版本
1.1.0
CLS 安全性认证2026-05-13
点击查看完整报告 >

使用说明

核心用法

TubeScribe 是一个完全本地运行的 YouTube 视频处理技能,用户只需提供视频链接即可自动生成结构化文档和音频摘要。工作流程分为六个步骤:提取原始字幕数据、调用子代理进行智能分析与格式化、转换为 HTML/DOCX/Markdown 文档、可选生成 TTS 音频摘要、清理临时文件、打开输出结果。支持批量处理和队列管理,可处理多视频串联任务。

显著优点

1. 完全隐私保护:所有处理在本地完成,无需 API 密钥,视频内容不会上传至第三方服务器
2. 零成本使用:开源免费,无订阅费用或使用次数限制

3. 智能内容处理:自动识别多说话人(访谈/播客场景)、生成可点击时间戳、提取热门评论 sentiment

4. 灵活输出格式:支持专业 DOCX(需 pandoc)、自包含 HTML 或纯 Markdown

5. 音频摘要功能:集成 Kokoro TTS 或系统内置语音合成,适合通勤收听

6. 完善的错误处理:对私享视频、地区限制、无字幕、直播中等情况提供明确报错

潜在局限

1. 依赖外部工具链:需要单独安装 summarize CLI、可选组件 pandoc/ffmpeg/yt-dlp,首次配置有一定门槛
2. 字幕依赖性:无法为无字幕视频生成转录(不支持语音识别)

3. 说话人识别启发式:基于语境猜测而非声纹识别,复杂多轮对话可能误判

4. 平台限制:主要面向 macOS(使用 brew installopen 命令),跨平台支持未明确

5. 长视频处理成本:超过30分钟视频需延长子代理超时时间,消耗更多本地算力

适合人群

  • 研究人员、记者、学生:需要系统整理访谈、讲座、纪录片内容
  • 播客听众:希望快速浏览内容并生成随身音频摘要
  • 内容创作者:批量提取视频脚本、分析评论区反馈
  • 隐私敏感用户:拒绝将观看历史或视频内容提交云端服务

常规风险

  • 版权合规:转录受版权保护的内容可能违反 YouTube 服务条款或当地法律
  • 字幕准确性:自动生成的 YouTube 字幕可能存在错误,影响摘要质量
  • 本地存储:临时文件和输出文档占用磁盘空间,需定期清理
  • 依赖维护:yt-dlp 等工具需跟随 YouTube 反爬虫机制更新,可能偶发失效

安全解读

核心用法

TubeScribe 是一款专为 YouTube 内容设计的本地转录与摘要工具。用户只需提供视频链接,系统即可自动完成:提取视频元数据与字幕、识别多位说话人、生成结构化摘要文档、导出为 HTML/DOCX/Markdown 格式,并可选择性生成音频摘要。整个流程通过 Python 脚本驱动,支持子代理深度处理长视频内容。

核心命令为 python skills/tubescribe/scripts/tubescribe.py "YOUTUBE_URL",执行后会生成包含完整转录、关键引用、可点击时间戳及观众评论分析的格式化文档。

显著优点

完全本地化与隐私优先:无需订阅、无需 API 密钥、无数据上传,所有处理在本地完成,符合 GDPR 数据最小化原则。支持离线运行,适合对隐私敏感的用户。

多维度输出能力:不仅提供文字转录,还集成 Kokoro TTS 高质量语音合成,可将摘要转换为 MP3/WAV 音频。文档格式灵活,满足编辑、存档、分享等不同场景。

智能内容理解:自动识别视频中的多位说话人(适用于访谈、播客),提取关键引用并生成带超链接的时间戳,观众评论分析功能可快速把握社群反馈。

零配置开箱即用:依赖 Homebrew 生态一键安装,提供详细的配置系统(~/.tubescribe/config.json)供进阶用户自定义,同时支持队列批处理提升效率。

潜在缺点与局限性

外部依赖较重:核心功能依赖 summarize CLI、可选依赖包括 pandoc、ffmpeg、yt-dlp 及 Kokoro TTS,首次配置需安装多个二进制工具,跨平台兼容性(尤其 Windows)未明确说明。

网络与内容限制:依赖 YouTube 字幕可用性,无字幕视频无法处理;受 YouTube 区域限制、年龄验证、私人视频等约束;无法处理直播流。

说话人识别准确率:虽声称智能识别,但自动区分说话人依赖启发式规则(问题/回答模式、说话时长等),复杂场景(多人同时说话、背景嘈杂)可能出现误判。

长视频处理开销:超过 30 分钟的视频需延长子代理超时时间至 900 秒,本地 LLM 处理大文本对硬件有一定要求。

适合人群

  • 研究者与学者:需要归档、引用 YouTube 学术讲座内容
  • 内容创作者与编辑:快速提炼访谈素材、生成节目笔记
  • 播客听众:将视频访谈转为可检索文字稿及便携音频摘要
  • 隐私敏感用户:拒绝云端转录服务的数据收集行为
  • 效率工具爱好者:偏好命令行工作流与自动化批处理

常规风险

依赖维护风险:yt-dlp 等工具因 YouTube 平台变动需频繁更新,Skill 未内置自动更新机制,过时依赖可能导致功能失效。

下载安全建议:当前版本从 GitHub 下载外部二进制时未验证 SHA256 校验和(建议未来版本添加),用户需确保网络环境可信。

数据残留风险:虽支持临时文件清理,但用户需确认配置中 cleanup_temp_files 已启用,避免 /tmp 目录残留视频元数据。

TubeScribe 内容

scripts文件夹
手动下载zip · 30.9 kB
config.pytext/plain
请选择文件