核心用法
Veo 是 Google 推出的文本生成视频(Text-to-Video)模型,本 Skill 通过命令行脚本封装了对 Veo 3.1、Veo 3.0 等版本的 API 调用。用户只需提供自然语言描述即可生成 8 秒或更长的视频片段,输出为标准 MP4 格式。
基本命令结构:
uv run scripts/generate_video.py --prompt "描述文本" --filename "output.mp4"
关键参数:
--duration: 视频时长(默认 8 秒,上限因模型而异)--aspect-ratio: 画面比例(16:9 横屏、9:16 竖屏、1:1 方形)--model: 模型版本选择,推荐veo-3.1-generate-preview获取最佳画质
认证方式:
- 环境变量
GEMINI_API_KEY(推荐) - 或配置文件
~/.clawdbot/clawdbot.json中设置
显著优点
1. 官方 API 直连:直接调用 Google 第一方服务,非第三方代理或逆向工程,稳定性和合规性有保障
2. 模型版本可选:明确区分 Veo 3.1(高质量预览版)、Veo 3.0 标准版、Veo 3.0-fast(快速低质版),用户可按场景权衡质量与速度
3. 输出标准化:统一输出 MP4 格式,兼容性强;脚本自动生成 MEDIA: 标记便于 Clawdbot 自动附加到聊天消息
4. 比例灵活:原生支持横竖方三种主流视频比例,适配不同社交平台需求
潜在缺点与局限性
- API 密钥门槛:需自行申请 Gemini API Key,部分地区或账户可能存在访问限制
- 预览版不稳定:
veo-3.1-generate-preview标注为预览版本,API 行为可能变更 - 时长受限:单条生成时长有限(默认 8 秒),长视频需拼接或多段生成
- 无编辑能力:纯文生视频,不支持图生视频、视频编辑、风格迁移等进阶功能
- 成本不透明:Google 官方定价需另行查阅,本 Skill 未内置用量统计
适合人群
- 需要快速生成短视频素材的内容创作者、社媒运营者
- 已持有 Gemini API Key 的开发者或团队
- 对视频质量有基础要求、但无需精细控制的轻量级用户
常规风险
- API 密钥泄露:密钥存储于环境变量或配置文件,需确保文件权限安全
- 内容合规:生成内容受 Google 服务条款约束,可能触发内容安全过滤
- 预览版服务中断:预览版 API 可能随时调整或下线
- 依赖单一供应商:绑定 Google 生态,存在平台政策变更风险