使用说明

核心用法

Veo 是 Google 推出的文本生成视频（Text-to-Video）模型，本 Skill 通过命令行脚本封装了对 Veo 3.1、Veo 3.0 等版本的 API 调用。用户只需提供自然语言描述即可生成 8 秒或更长的视频片段，输出为标准 MP4 格式。

基本命令结构：

uv run scripts/generate_video.py --prompt "描述文本" --filename "output.mp4"

关键参数：

--duration: 视频时长（默认 8 秒，上限因模型而异）
--aspect-ratio: 画面比例（16:9 横屏、9:16 竖屏、1:1 方形）
--model: 模型版本选择，推荐 veo-3.1-generate-preview 获取最佳画质

认证方式：

环境变量 GEMINI_API_KEY（推荐）
或配置文件 ~/.clawdbot/clawdbot.json 中设置

显著优点

1. 官方 API 直连：直接调用 Google 第一方服务，非第三方代理或逆向工程，稳定性和合规性有保障
2. 模型版本可选：明确区分 Veo 3.1（高质量预览版）、Veo 3.0 标准版、Veo 3.0-fast（快速低质版），用户可按场景权衡质量与速度
3. 输出标准化：统一输出 MP4 格式，兼容性强；脚本自动生成 MEDIA: 标记便于 Clawdbot 自动附加到聊天消息
4. 比例灵活：原生支持横竖方三种主流视频比例，适配不同社交平台需求

潜在缺点与局限性

API 密钥门槛：需自行申请 Gemini API Key，部分地区或账户可能存在访问限制
预览版不稳定：veo-3.1-generate-preview 标注为预览版本，API 行为可能变更
时长受限：单条生成时长有限（默认 8 秒），长视频需拼接或多段生成
无编辑能力：纯文生视频，不支持图生视频、视频编辑、风格迁移等进阶功能
成本不透明：Google 官方定价需另行查阅，本 Skill 未内置用量统计

适合人群

需要快速生成短视频素材的内容创作者、社媒运营者
已持有 Gemini API Key 的开发者或团队
对视频质量有基础要求、但无需精细控制的轻量级用户

常规风险

API 密钥泄露：密钥存储于环境变量或配置文件，需确保文件权限安全
内容合规：生成内容受 Google 服务条款约束，可能触发内容安全过滤
预览版服务中断：预览版 API 可能随时调整或下线
依赖单一供应商：绑定 Google 生态，存在平台政策变更风险

安全解读

核心用法

Veo Skill 基于 Google 官方 google-genai SDK，提供命令行方式调用 Google Veo 视频生成模型。用户通过自然语言描述或结合参考图片，即可生成 8 秒（默认）至更长时长的高质量视频片段。

基础命令结构：

uv run {baseDir}/scripts/generate_video.py --prompt "描述文本" --filename "output.mp4"

关键参数：

--duration / -d：视频时长（秒），Veo 3.1 支持更长时长
--aspect-ratio / -a：画面比例（16:9 横屏、9:16 竖屏、1:1 方形）
--model：模型版本选择
veo-3.1-generate-preview：最高质量（推荐）
veo-3.0-generate-001：标准质量
veo-3.0-fast-generate-001：快速生成，质量略低

认证配置：
优先通过 GEMINI_API_KEY 环境变量注入 API 密钥，或配置于 ~/.clawdbot/clawdbot.json 的 skills."veo".env.GEMINI_API_KEY 字段。

输出特性：
生成 MP4 格式视频文件，脚本输出包含 MEDIA: 标记行，支持 Clawdbot 在兼容的聊天平台自动附加媒体文件。

---

显著优点

1. 官方原生集成：直接调用 Google 官方 Veo API，非第三方代理，确保模型能力与官方同步
2. 多模型版本支持：覆盖 Veo 2.0、3.0、3.1 全系列，用户可按质量-速度需求灵活选择
3. 灵活的画面适配：原生支持横屏、竖屏、方屏三种主流比例，适应短视频、横版内容等多场景
4. 安全合规设计：API 密钥环境变量管理，无硬编码；仅与 Google 官方端点通信，TLS 1.3 加密
5. 零依赖风险：仅依赖 Google 官方 google-genai 库，无第三方中转服务

---

潜在缺点与局限性

| 维度 | 说明 |

|------|------|

成本 | Veo API 按生成时长计费，高频使用成本较高，无免费额度 |

| **可控性** | 文本生成视频存在随机性，同一提示词多次生成结果可能差异较大 |

| **时长限制** | 单次生成有最大时长上限（具体取决于模型版本），长视频需分段生成后拼接 |

| **内容审核** | 受 Google 安全过滤器限制，部分敏感主题可能被拒绝生成 |

| **网络依赖** | 需稳定连接 Google API，中国大陆等地区可能需要网络代理 |

| **预览版稳定性** | `veo-3.1-generate-preview` 为预览版本，API 行为可能变动 |

---

适合人群

内容创作者：快速生成概念验证视频、社交媒体素材
开发者/产品经理：原型视频制作、UI 动效预览
营销团队：广告素材快速迭代、多版本 A/B 测试
教育工作者：教学演示视频生成

不适合： 对生成结果有像素级精确控制需求的专业影视制作；完全离线环境；对 API 成本极度敏感的高频批量场景。

---

常规风险

1. API 密钥泄露风险：若环境变量配置不当或被意外打印到日志，可能导致密钥滥用。建议定期轮换密钥，避免在共享环境中明文暴露。
2. 生成内容版权争议：Veo 生成的视频可能涉及训练数据的版权模糊地带，商业使用需关注 Google 服务条款及当地法律法规。
3. 提示词注入风险：虽然本 Skill 无直接的提示词投毒漏洞，但用户输入的恶意提示词可能触发 Google 的内容安全拦截，导致账号受限。
4. 预览版 API 变更：Veo 3.1 预览版接口可能调整，需关注更新日志避免脚本失效。
5. 存储空间消耗：高清视频文件较大，频繁生成需注意磁盘空间管理。

---

安全认证说明：本 Skill 经 CLS-Certify v2.1.0 全量扫描，获 S+ 评级（满分 100），静态分析、动态行为、依赖审计、网络流量、隐私合规、威胁情报六项均通过。

video-generation google ai-video text-to-video veo gemini content-creation media-production

Veo 内容

scripts文件夹

手动下载zip · 2.8 kB

generate_video.pytext/plain

请选择文件