使用说明

核心用法

youtube-editor 是一套端到端的 YouTube 内容自动化工具。用户只需提供 YouTube 链接或本地视频文件，即可完成从素材获取到成品输出的完整工作流：

1. 视频获取：支持 YouTube URL 下载（内置 URL 白名单验证，阻止 localhost/私有 IP）或本地文件输入
2. 语音转录：调用 OpenAI Whisper 自动生成高精度 .srt 字幕文件
3. 内容分析：使用 GPT-4 分析视频内容，生成韩语优化的 SEO 标题、描述和标签
4. AI 缩略图生成（可选 Pro 功能）：通过 nano-banana-pro 技能实现图像到图像生成，保持角色风格一致性——既可使用默认"海盗龙虾"形象，也可上传个人照片作为锚定角色

显著优点

全流程自动化：将传统需数小时的剪辑、字幕、文案、设计工作压缩至分钟级
角色一致性：Image-to-Image 技术确保同一角色在不同视频中姿势/场景变化时保持视觉统一，解决 AI 图像生成最大痛点
本土化支持：专门针对韩语 YouTube 生态优化元数据生成
专业级输出：内置 Paperlogy ExtraBold 字体、自动抠图、黑金配色布局
安全加固：v1.0.11+ 版本加入 URL 验证、HTML 转义、固定脚本路径、900 秒超时等多重防护

潜在缺点与局限性

依赖外部 API：强制依赖 OpenAI（Whisper + GPT-4），可选依赖 Nano Banana（图像生成），成本与可用性受制第三方
系统依赖复杂：需手动安装 FFmpeg，高级功能还需 playwright 和 rembg，环境配置门槛较高
可选功能链式依赖：AI 缩略图功能要求用户额外安装 nano-banana-pro 技能，非开箱即用
角色生成可控性有限：风格一致性虽优于随机生成，但复杂姿势或特定服饰细节仍可能出现漂移
韩语优化单一：非韩语内容用户无法切换语言模型，灵活性不足

适合人群

高频产出 YouTube 内容的个人创作者或 MCN 机构
需要批量处理视频转录与多语言文案的跨境内容团队
重视品牌视觉一致性、有固定虚拟形象或真人 IP 的频道主
具备基础 Python/命令行操作能力的技术型创作者

常规风险

API 密钥泄露风险：OPENAI_API_KEY 和 NANO_BANANA_KEY 需环境变量配置，共享环境或日志不当可能暴露
成本不可控：长视频转录 + GPT-4 Token 消耗 + 图像生成叠加，高频使用可能产生显著费用
版权边界模糊：YouTube 下载功能可能触及平台 ToS；AI 生成角色若基于真人照片，肖像权需自行厘清
供应链风险：OpenAI 或 Nano Banana 服务中断将直接导致功能失效

安全解读

核心用法

YouTube Editor 是一款面向内容创者的全流程自动化视频编辑工具，覆盖从素材获取到成品输出的完整链路。用户只需提供 YouTube 链接或本地视频文件，即可自动完成：视频下载（yt-dlp）、语音转字幕（OpenAI Whisper）、内容智能分析（GPT-4 生成韩文优化标题/描述/标签）、以及 AI 封面图生成（可选调用 nano-banana-pro 实现风格一致的虚拟形象生成）。

显著优点

1. 全流程自动化：将原本分散在多个工具中的操作整合为单命令执行，大幅降低视频后期时间成本
2. 韩文本地化支持：针对韩国市场优化的 SEO 内容生成，适合跨语种内容运营
3. 一致性角色生成：通过 Image-to-Image 技术保持虚拟形象风格统一，解决 AI 绘图角色不一致痛点
4. 安全防护机制：URL 白名单验证（阻断内网/本地地址）、HTML 内容转义防 XSS、子进程 900 秒超时保护

潜在缺点与局限

外部依赖风险：核心功能依赖 OpenAI API、YouTube 服务稳定性，以及可选的 nano-banana-pro Skill，任一节点的服务中断或变更都会影响功能
供应链安全隐患：yt-dlp、rembg 等依赖库本身也使用 subprocess，形成嵌套调用链；依赖版本未锁定，存在 typosquatting 攻击面
跨 Skill 调用风险：通过 subprocess 调用 nano-banana-pro 属于非受控集成，被调用 Skill 的安全性未经验证
T3 来源可信度：个人开发者作品，无公开仓库可审计，更新维护连续性存疑

适合人群

高频产出的 YouTube 内容创作者（尤其面向韩国市场的频道）
希望建立统一虚拟形象 IP 的自媒体运营者
具备基础技术能力、能独立排查依赖问题的用户

常规风险

API 密钥泄露风险（需通过环境变量配置，建议配合密钥管理服务使用）
视频内容上传至第三方云端（OpenAI）进行转录和分析，涉及数据出境合规考量
AI 生成内容的版权归属与平台政策合规风险
subprocess 执行 ffmpeg/uv run 的潜在命令注入面（虽已实施路径固定和超时保护）

video-editing youtube automation ai-content-generation transcription whisper gpt-4 thumbnail-design korean-language character-consistency image-to-image

Youtube Editor 内容

scripts文件夹

手动下载zip · 7.0 kB

process_video.pytext/plain

请选择文件