Veo

🎬 Google 官方文生视频,一键生成 MP4

creative榜 #5

Google Veo 官方视频生成 API,支持文生视频,输出高质量 MP4,需配置 Gemini API Key。

收藏
17.6k
安装
5.4k
版本
1.3.0
CLS 安全性认证2026-05-16
点击查看完整报告 >

使用说明

核心用法

Veo 是 Google 推出的文本生成视频(Text-to-Video)模型,本 Skill 通过命令行脚本封装了对 Veo 3.1、Veo 3.0 等版本的 API 调用。用户只需提供自然语言描述即可生成 8 秒或更长的视频片段,输出为标准 MP4 格式。

基本命令结构:

uv run scripts/generate_video.py --prompt "描述文本" --filename "output.mp4"

关键参数:

  • --duration: 视频时长(默认 8 秒,上限因模型而异)
  • --aspect-ratio: 画面比例(16:9 横屏、9:16 竖屏、1:1 方形)
  • --model: 模型版本选择,推荐 veo-3.1-generate-preview 获取最佳画质

认证方式:

  • 环境变量 GEMINI_API_KEY(推荐)
  • 或配置文件 ~/.clawdbot/clawdbot.json 中设置

显著优点

1. 官方 API 直连:直接调用 Google 第一方服务,非第三方代理或逆向工程,稳定性和合规性有保障
2. 模型版本可选:明确区分 Veo 3.1(高质量预览版)、Veo 3.0 标准版、Veo 3.0-fast(快速低质版),用户可按场景权衡质量与速度

3. 输出标准化:统一输出 MP4 格式,兼容性强;脚本自动生成 MEDIA: 标记便于 Clawdbot 自动附加到聊天消息

4. 比例灵活:原生支持横竖方三种主流视频比例,适配不同社交平台需求

潜在缺点与局限性

  • API 密钥门槛:需自行申请 Gemini API Key,部分地区或账户可能存在访问限制
  • 预览版不稳定veo-3.1-generate-preview 标注为预览版本,API 行为可能变更
  • 时长受限:单条生成时长有限(默认 8 秒),长视频需拼接或多段生成
  • 无编辑能力:纯文生视频,不支持图生视频、视频编辑、风格迁移等进阶功能
  • 成本不透明:Google 官方定价需另行查阅,本 Skill 未内置用量统计

适合人群

  • 需要快速生成短视频素材的内容创作者、社媒运营者
  • 已持有 Gemini API Key 的开发者或团队
  • 对视频质量有基础要求、但无需精细控制的轻量级用户

常规风险

  • API 密钥泄露:密钥存储于环境变量或配置文件,需确保文件权限安全
  • 内容合规:生成内容受 Google 服务条款约束,可能触发内容安全过滤
  • 预览版服务中断:预览版 API 可能随时调整或下线
  • 依赖单一供应商:绑定 Google 生态,存在平台政策变更风险

安全解读

核心用法

Veo Skill 基于 Google 官方 google-genai SDK,提供命令行方式调用 Google Veo 视频生成模型。用户通过自然语言描述或结合参考图片,即可生成 8 秒(默认)至更长时长的高质量视频片段。

基础命令结构:

uv run {baseDir}/scripts/generate_video.py --prompt "描述文本" --filename "output.mp4"

关键参数:

  • --duration / -d:视频时长(秒),Veo 3.1 支持更长时长
  • --aspect-ratio / -a:画面比例(16:9 横屏、9:16 竖屏、1:1 方形)
  • --model:模型版本选择
  • veo-3.1-generate-preview:最高质量(推荐)
  • veo-3.0-generate-001:标准质量
  • veo-3.0-fast-generate-001:快速生成,质量略低

认证配置:
优先通过 GEMINI_API_KEY 环境变量注入 API 密钥,或配置于 ~/.clawdbot/clawdbot.jsonskills."veo".env.GEMINI_API_KEY 字段。

输出特性:
生成 MP4 格式视频文件,脚本输出包含 MEDIA: 标记行,支持 Clawdbot 在兼容的聊天平台自动附加媒体文件。

---

显著优点

1. 官方原生集成:直接调用 Google 官方 Veo API,非第三方代理,确保模型能力与官方同步
2. 多模型版本支持:覆盖 Veo 2.0、3.0、3.1 全系列,用户可按质量-速度需求灵活选择

3. 灵活的画面适配:原生支持横屏、竖屏、方屏三种主流比例,适应短视频、横版内容等多场景

4. 安全合规设计:API 密钥环境变量管理,无硬编码;仅与 Google 官方端点通信,TLS 1.3 加密

5. 零依赖风险:仅依赖 Google 官方 google-genai 库,无第三方中转服务

---

潜在缺点与局限性

| 维度 | 说明 |
|------|------|

成本 | Veo API 按生成时长计费,高频使用成本较高,无免费额度 |

| **可控性** | 文本生成视频存在随机性,同一提示词多次生成结果可能差异较大 |
| **时长限制** | 单次生成有最大时长上限(具体取决于模型版本),长视频需分段生成后拼接 |
| **内容审核** | 受 Google 安全过滤器限制,部分敏感主题可能被拒绝生成 |
| **网络依赖** | 需稳定连接 Google API,中国大陆等地区可能需要网络代理 |
| **预览版稳定性** | `veo-3.1-generate-preview` 为预览版本,API 行为可能变动 |

---

适合人群

  • 内容创作者:快速生成概念验证视频、社交媒体素材
  • 开发者/产品经理:原型视频制作、UI 动效预览
  • 营销团队:广告素材快速迭代、多版本 A/B 测试
  • 教育工作者:教学演示视频生成

不适合: 对生成结果有像素级精确控制需求的专业影视制作;完全离线环境;对 API 成本极度敏感的高频批量场景。

---

常规风险

1. API 密钥泄露风险:若环境变量配置不当或被意外打印到日志,可能导致密钥滥用。建议定期轮换密钥,避免在共享环境中明文暴露。
2. 生成内容版权争议:Veo 生成的视频可能涉及训练数据的版权模糊地带,商业使用需关注 Google 服务条款及当地法律法规。

3. 提示词注入风险:虽然本 Skill 无直接的提示词投毒漏洞,但用户输入的恶意提示词可能触发 Google 的内容安全拦截,导致账号受限。

4. 预览版 API 变更:Veo 3.1 预览版接口可能调整,需关注更新日志避免脚本失效。

5. 存储空间消耗:高清视频文件较大,频繁生成需注意磁盘空间管理。

---

安全认证说明:本 Skill 经 CLS-Certify v2.1.0 全量扫描,获 S+ 评级(满分 100),静态分析、动态行为、依赖审计、网络流量、隐私合规、威胁情报六项均通过。

Veo 内容

scripts文件夹
手动下载zip · 2.8 kB
generate_video.pytext/plain
请选择文件