使用说明

核心用法

该 Skill 是一款命令行 YouTube 视频转录工具，调用 Google Gemini 大模型生成逐字稿。用户只需提供 YouTube URL，工具即可返回带说话人标签的纯净文本格式（Speaker: text），自动跳过时间戳和冗余标记。

使用方式：

python3 scripts/youtube_transcript.py "https://www.youtube.com/watch?v=..." [--out <路径>]

输出默认保存至工作目录 out/ 文件夹，首行为视频标题，后续为说话人分段对话。

显著优点

输出格式纯净：自动生成 Speaker: text 格式，无时间码干扰，直接适用于会议纪要、内容摘要等场景
依赖极简：仅使用 Python 标准库（urllib、json、os、sys），零第三方包依赖，部署轻便
安全基线较高：输出路径受限（工作目录、/tmp 或 TMPDIR），防止目录遍历；无硬编码凭证
合规友好：符合 GDPR 数据最小化原则，无主动数据收集行为

潜在局限

需要自备 API Key：依赖用户配置的 GEMINI_API_KEY，对新手不够便捷
无时间戳信息：若需精确时间定位，本工具无法满足
T3 来源风险：由个人开发者维护（GitHub: odrobnik），非企业/基金会背书，需自行跟踪更新
网络依赖：必须访问 Google Generative Language API 和 YouTube oEmbed，国内网络环境可能受限
错误信息暴露：API 报错时会将原始响应输出至 stderr，存在意外泄露敏感信息的可能

适合人群

播客/访谈整理者、会议纪要员、内容创作者
需要快速获取 YouTube 视频文字稿的研究者、记者
熟悉命令行操作、能自行管理 API Key 的技术用户

常规风险

密钥管理：环境变量方式虽标准，但在共享环境或日志中可能意外暴露
API 成本：Gemini API 调用产生费用，长视频需注意用量
输出覆盖：自动命名文件可能覆盖同名历史文件，建议显式指定 --out 路径
模型幻觉：大模型生成的转录可能存在识别误差，重要场景建议人工复核

安全解读

核心用法

该 Skill 通过调用 Google Gemini API 为 YouTube 视频生成逐字转录。用户只需提供 YouTube 视频链接，工具会自动提取视频信息并返回格式化的文字记录，包含说话人标签（如 "Speaker 1:"），自动分段，无时间戳干扰。

使用方式：

python3 scripts/youtube_transcript.py "https://www.youtube.com/watch?v=..."

可选 --out <path> 指定输出文件，默认保存至工作区 out/ 文件夹。

显著优点

1. 零第三方依赖：仅使用 Python 标准库（urllib、json、os、sys、pathlib），无供应链攻击风险
2. 路径安全：文件写入严格限制在工作区或 /tmp 目录，防止路径遍历攻击
3. 网络受限：仅连接 Google Gemini API 和 YouTube oEmbed 两个可信服务端点
4. 隐私合规：仅访问 GEMINI_API_KEY 环境变量，无过度数据收集
5. 输出干净：自动标注说话人、智能分段，无冗余时间戳和格式干扰

潜在缺点与局限性

依赖外部 API：需有效的 Gemini API 密钥，且受 Google 服务可用性影响
无重试机制：网络波动或 API 限流时可能失败，需手动重试
仅支持 YouTube：无法处理其他平台的视频内容
无时间戳：如需精确时间定位需配合其他工具
API 成本：大量转录可能产生 Gemini API 调用费用

适合人群

内容创作者需要快速获取视频文案
研究人员整理访谈、讲座记录
字幕制作人员获取原始文本素材
需将视频内容转为可搜索文档的用户

常规风险

| 风险类型 | 等级 | 说明 |

|---------|------|------|

| API 密钥泄露 | 中 | 需安全保管 GEMINI_API_KEY，避免硬编码或日志泄露 |

| 转录准确性 | 中 | Gemini 对口音、专业术语、多人重叠对话识别可能不完美 |

| 版权合规 | 低 | 转录他人视频需遵守 YouTube 服务条款和版权法规 |

| 数据出境 | 低 | 视频内容通过 Google API 处理，需符合所在地数据法规 |

transcription youtube google-gemini ai-transcription video-to-text cli-tool speaker-diarization productivity content-creation

Gemini Yt Video Transcript 内容

scripts文件夹

手动下载zip · 3.6 kB

youtube_transcript.pytext/plain

请选择文件