使用说明

核心用法

veo 是一个调用 Google Veo API 进行 AI 视频生成的技能，支持通过文本提示词或参考图片生成高质量视频内容。用户通过命令行工具 generate_video.py 执行生成任务，核心参数包括视频描述（--prompt）、输出文件名（--filename）、时长（--duration）、宽高比（--aspect-ratio）以及模型版本（--model）。支持 Veo 2.0、Veo 3.0 和 Veo 3.1 多个版本，其中 Veo 3.1 提供更高质量和更长时长，Veo 3.0-fast 则侧重生成速度。配置需设置 GEMINI_API_KEY 环境变量，输出格式为 MP4，脚本会自动输出 MEDIA:: 标记以便 Clawdbot 在支持的聊天平台中直接展示视频。

显著优点

1. 官方 API 保障：基于 Google 官方 google-genai SDK，技术栈成熟可靠，无第三方中间件风险。
2. 多版本灵活选择：Veo 3.1 预览版适合追求画质的场景，Veo 3.0-fast 适合快速迭代，满足不同效率需求。
3. 输入方式多样：支持纯文本生成，也可叠加最多 3 张参考图片进行图生视频，创作自由度较高。
4. 参数控制精细：宽高比覆盖横屏（16:9）、竖屏（9:16）、方屏（1:1），适配社交媒体、演示文稿等多平台发布需求。
5. 输出安全可控：自动创建输出目录、不覆盖现有文件、无删除操作，文件系统交互边界清晰。

潜在缺点与局限性

1. 网络依赖性强：必须连接 Google API 服务，离线环境完全无法使用，网络波动可能影响生成稳定性。
2. 数据上传必然性：提示词和参考图片必须上传至 Google 服务器，存在数据隐私顾虑，不适合处理敏感或机密内容。
3. 成本门槛：需自行申请并管理 GEMINI_API_KEY，Google Veo API 按使用量计费，高频使用成本较高。
4. 生成时长受限：单次生成时长存在上限（默认 8 秒，具体上限因模型而异），长视频需分段生成后剪辑拼接。
5. T3 来源维护风险：项目由个人/社区维护，长期更新保障、安全响应速度不及企业级官方项目。

适合的目标群体

内容创作者与自媒体运营者：快速生成短视频素材，适配抖音、YouTube Shorts、Instagram Reels 等平台规格。
营销与广告团队：制作产品展示、概念预览视频，降低传统视频制作的时间与人力成本。
设计师与创意工作者：将静态设计稿转化为动态视频，探索视觉概念的动态呈现效果。
教育与培训领域：生成教学演示、场景模拟视频，丰富多媒体课件内容。
原型验证与敏捷开发团队：快速产出 MVP 级视频内容，用于用户测试或投资人演示。

使用风险

1. API 密钥泄露风险：若 GEMINI_API_KEY 管理不当（如硬编码、误提交至版本控制），可能导致密钥被盗用产生额外费用。
2. 内容合规风险：AI 生成视频需遵守 Google API 使用政策及当地法律法规，避免生成侵权、虚假或违规内容。
3. 存储与性能风险：高清视频文件体积较大，需确保本地磁盘空间充足；生成过程受网络带宽和 Google 服务端负载影响，可能出现延迟或失败。
4. 版本兼容性风险：Veo 3.1 处于预览阶段，API 接口或功能可能调整，生产环境建议锁定稳定版本。

安全解读

核心用法

Veo 技能通过 Google 官方 API 生成视频内容，支持 Veo 2.0、3.0 及最新的 3.1 预览版模型。核心命令为：

uv run {baseDir}/scripts/generate_video.py --prompt "视频描述" --filename "output.mp4"

关键参数：

--duration/-d: 视频时长（默认 8 秒，上限因模型而异）
--aspect-ratio/-a: 宽高比（16:9、9:16、1:1）
--model: 模型选择，推荐使用 veo-3.1-generate-preview 获取最佳画质，或 veo-3.0-fast-generate-001 换取生成速度

认证方式：通过 GEMINI_API_KEY 环境变量或配置文件注入，无硬编码密钥风险。

显著优点

1. 模型迭代领先：支持 Veo 3.1 预览版，在画质、时长上限和语义理解方面优于早期版本
2. 输出格式标准：直接生成 MP4，无需额外转码，且自动输出 MEDIA: 标记便于 Clawdbot 在支持的平台直接展示
3. 参数灵活：支持三种主流宽高比，适配横屏、竖屏、方形多场景
4. 安全架构清晰：代码经过完整静态与动态扫描，无危险函数、无敏感信息泄露、无权限诱导

潜在缺点与局限性

依赖透明度待提升：当前通过 inline script metadata 管理依赖，缺少 lock 文件，版本锁定不够严格
输入校验缺失：prompt 长度无上限检查，极端情况下可能触发 API 侧拒绝
超时未显式配置：使用默认网络超时，弱网环境可能长时间无响应
成本敏感：Veo 3.1 为 Google 旗舰级视频模型，调用成本显著高于文生图或早期视频模型
生成耗时：高质量模式下单次生成可达数分钟，非实时交互场景

适合人群

内容创作者：快速生成概念视频、广告素材、社交媒体短视频
开发者/设计师：需要程序化批量生成视频原型或 A/B 测试素材
AI 工作流整合者：已通过 Gemini API 使用其他 Google 生成能力，希望统一账单和认证

常规风险

API 密钥管理：需妥善保管 GEMINI_API_KEY，避免泄露导致配额滥用
内容合规：生成内容受 Google 服务条款约束，敏感题材可能触发内容过滤
预览版稳定性：veo-3.1-generate-preview 为预览版本，API 行为或定价可能调整
网络依赖：完全依赖 Google 云端服务，无离线运行能力

content-media image-gen api productivity marketing

veo 内容

scripts文件夹

手动下载zip · 3.0 kB

generate_video.pytext/plain

请选择文件