Gemini Yt Video Transcript

✨ Gemini 驱动·纯净转录

通过 Google Gemini API 为 YouTube 视频生成带说话人标签的逐字转录稿,无需时间戳,输出简洁清晰。

收藏
14k
安装
3.5k
版本
1.0.4
CLS 安全性认证2026-05-06
点击查看完整报告 >

使用说明

核心用法

该 Skill 是一款命令行 YouTube 视频转录工具,调用 Google Gemini 大模型生成逐字稿。用户只需提供 YouTube URL,工具即可返回带说话人标签的纯净文本格式(Speaker: text),自动跳过时间戳和冗余标记。

使用方式

python3 scripts/youtube_transcript.py "https://www.youtube.com/watch?v=..." [--out <路径>]

输出默认保存至工作目录 out/ 文件夹,首行为视频标题,后续为说话人分段对话。

显著优点

  • 输出格式纯净:自动生成 Speaker: text 格式,无时间码干扰,直接适用于会议纪要、内容摘要等场景
  • 依赖极简:仅使用 Python 标准库(urllib、json、os、sys),零第三方包依赖,部署轻便
  • 安全基线较高:输出路径受限(工作目录、/tmp 或 TMPDIR),防止目录遍历;无硬编码凭证
  • 合规友好:符合 GDPR 数据最小化原则,无主动数据收集行为

潜在局限

  • 需要自备 API Key:依赖用户配置的 GEMINI_API_KEY,对新手不够便捷
  • 无时间戳信息:若需精确时间定位,本工具无法满足
  • T3 来源风险:由个人开发者维护(GitHub: odrobnik),非企业/基金会背书,需自行跟踪更新
  • 网络依赖:必须访问 Google Generative Language API 和 YouTube oEmbed,国内网络环境可能受限
  • 错误信息暴露:API 报错时会将原始响应输出至 stderr,存在意外泄露敏感信息的可能

适合人群

  • 播客/访谈整理者、会议纪要员、内容创作者
  • 需要快速获取 YouTube 视频文字稿的研究者、记者
  • 熟悉命令行操作、能自行管理 API Key 的技术用户

常规风险

  • 密钥管理:环境变量方式虽标准,但在共享环境或日志中可能意外暴露
  • API 成本:Gemini API 调用产生费用,长视频需注意用量
  • 输出覆盖:自动命名文件可能覆盖同名历史文件,建议显式指定 --out 路径
  • 模型幻觉:大模型生成的转录可能存在识别误差,重要场景建议人工复核

安全解读

核心用法

该 Skill 通过调用 Google Gemini API 为 YouTube 视频生成逐字转录。用户只需提供 YouTube 视频链接,工具会自动提取视频信息并返回格式化的文字记录,包含说话人标签(如 "Speaker 1:"),自动分段,无时间戳干扰。

使用方式

python3 scripts/youtube_transcript.py "https://www.youtube.com/watch?v=..."

可选 --out <path> 指定输出文件,默认保存至工作区 out/ 文件夹。

显著优点

1. 零第三方依赖:仅使用 Python 标准库(urllib、json、os、sys、pathlib),无供应链攻击风险
2. 路径安全:文件写入严格限制在工作区或 /tmp 目录,防止路径遍历攻击

3. 网络受限:仅连接 Google Gemini API 和 YouTube oEmbed 两个可信服务端点

4. 隐私合规:仅访问 GEMINI_API_KEY 环境变量,无过度数据收集

5. 输出干净:自动标注说话人、智能分段,无冗余时间戳和格式干扰

潜在缺点与局限性

  • 依赖外部 API:需有效的 Gemini API 密钥,且受 Google 服务可用性影响
  • 无重试机制:网络波动或 API 限流时可能失败,需手动重试
  • 仅支持 YouTube:无法处理其他平台的视频内容
  • 无时间戳:如需精确时间定位需配合其他工具
  • API 成本:大量转录可能产生 Gemini API 调用费用

适合人群

  • 内容创作者需要快速获取视频文案
  • 研究人员整理访谈、讲座记录
  • 字幕制作人员获取原始文本素材
  • 需将视频内容转为可搜索文档的用户

常规风险

| 风险类型 | 等级 | 说明 |
|---------|------|------|
| API 密钥泄露 | 中 | 需安全保管 GEMINI_API_KEY,避免硬编码或日志泄露 |
| 转录准确性 | 中 | Gemini 对口音、专业术语、多人重叠对话识别可能不完美 |
| 版权合规 | 低 | 转录他人视频需遵守 YouTube 服务条款和版权法规 |
| 数据出境 | 低 | 视频内容通过 Google API 处理,需符合所在地数据法规 |

Gemini Yt Video Transcript 内容

scripts文件夹
手动下载zip · 3.6 kB
youtube_transcript.pytext/plain
请选择文件