核心用法
HeyGen 是面向 AI 数字人视频的生成 API,现已弃用,被拆分为两个专注技能:
- `create-video`:通过自然语言提示一键生成视频(Video Agent API)
- `avatar-video`:精确控制 avatar、配音、场景和时长的 v2 API
主要工作流程
1. 提示词优化:使用 prompt-optimizer.md 和 visual-styles.md 结构化描述场景、时长、视觉风格
2. 视频生成:调用 MCP 工具 mcp__heygen__generate_video_agent 或直接 POST /v1/video_agent/generate
3. 状态轮询:通过 mcp__heygen__get_video 或 GET /v2/videos/{id} 获取下载链接
关键功能
- AI 数字人:100+ 虚拟形象,支持照片定制(Photo Avatars)
- 智能配音:多语言语音库,可调节语速音调
- 场景控制:背景替换、文字叠加、自动生成字幕
- 透明通道:输出 WebM 格式用于后期合成
- 模板系统:支持变量替换的批量生成
显著优点
- 零拍摄成本快速产出专业讲解视频
- 自然语言驱动,降低视频制作门槛
- 完善的 MCP 工具链,集成认证和格式化
- 丰富参考资料(20+ 预设视觉风格、完整提示词示例)
潜在局限
- 已弃用:该 skill 处于维护模式,未来版本将移除
- 视频生成需异步轮询,非即时返回
- 精细控制(逐场景配音、精确时长)需使用复杂 v2 API
- 依赖 API 积分额度,大规模使用成本需评估
适合人群
- 内容创作者、营销团队快速生成产品讲解
- 开发者集成数字人视频到自动化工作流
- 需多语言本地化视频的企业用户
常规风险
- API Key 泄露导致额度被盗用
- 生成内容需遵守平台 AUP(可接受使用政策)
- 数字人形象存在伦理争议风险
- 视频输出受版权素材使用限制