skills/matusvojtek/TubeScribe

TubeScribe

🎬 YouTube 视频一键转文档+音频

本地运行YouTube视频转录工具，自动生成带时间戳的文档、音频摘要和发言者识别，无需API密钥，完全免费。

收藏

13k

安装

4.5k

版本

1.1.5

CLS 安全扫描中

预计需要 3 分钟...

使用说明

核心用法

TubeScribe 是一款完全本地运行的 YouTube 视频处理工具，用户只需提供视频链接即可自动生成结构化文档和音频摘要。系统通过子代理（sub-agent）在后台异步处理视频，不阻塞主对话流程。

标准工作流：
1. 用户提供 YouTube URL
2. 立即生成子代理执行完整管道（提取→格式化→导出→音频生成）
3. 主会话继续响应其他内容
4. 子代理完成后通知用户结果

显著优点

完全免费：无订阅费用、无需 API 密钥、不调用外部服务
隐私优先：所有数据处理在本地完成，视频内容不上传云端
多模态输出：同时生成 Markdown/DOCX/HTML 文档 + MP3/WAV 音频摘要
智能功能：自动发言者识别、可点击时间戳跳转、观众评论情感分析
队列支持：支持批量处理和后台排队，适合连续处理多个视频
Apple Silicon 优化：集成 mlx-audio，利用 Apple 芯片实现极速 TTS

潜在局限

依赖字幕：无字幕视频无法处理（不支持语音转写）
格式限制：仅支持 YouTube，不支持其他平台
环境依赖：需要预装 Python 3.8+、pandoc、ffmpeg、yt-dlp 等工具
无实时处理：直播视频不支持，必须等待结束
区域限制：区域封锁/年龄限制视频无法访问

适合人群

内容创作者需要快速提取访谈/播客精华
学生和研究者整理讲座、教程笔记
需要离线收听摘要的通勤用户
注重隐私、不愿上传敏感视频内容的用户

常规风险

临时文件管理：配置不当可能残留 /tmp 文件（可开启自动清理）
长视频超时：超过30分钟视频需手动增加子代理超时时间
工具链维护：brew/pip 依赖更新可能破坏兼容性
TTS 质量：内置语音合成效果取决于所选引擎和模型

youtube transcription audio local-first privacy tts summarization document-generation

TubeScribe 内容

scripts文件夹

手动下载zip · 39.1 kB

config.pytext/plain

请选择文件