核心功能与用法
Yollomi AI API 是一个统一端点的图像与视频生成服务,通过 POST /api/v1/generate 单一接口调用 20+ 图像模型和 15+ 视频模型,包括 Flux 系列、Google Veo-3、OpenAI Sora-2、Kling、Runway Gen4 等主流方案。
核心工作流:
- 图像生成:设置
type: "image",选择modelId(如flux、imagen-4-ultra),提供 prompt 和aspectRatio(1:1/16:9/9:16) - 视频生成:设置
type: "video",选择视频模型(如kling-2-1、google-veo-3),提供 prompt 和可选输入帧 - 编辑处理:支持背景移除(
remove-bg)、换脸(face-swap)、图像超分(image-upscaler)、老照片修复(photo-restoration)、虚拟试衣(virtual-try-on)等
认证方式:Authorization: Bearer 或 X-API-Key 头,需配置 YOLLOMI_API_KEY 环境变量。
显著优势
1. 统一接口设计:所有模型共用 /api/v1/generate 端点,降低集成复杂度
2. 模型覆盖全面:集成文本生成图像(Flux/SD 3.5/Imagen)、视频生成(Sora/Veo/Kling/Runway)、图像编辑三大品类
3. 按需计费透明:图像 0-15 credits/张,视频 7-50+ credits/条,支持 remainingCredits 实时余额查询
4. 实用编辑工具链:免费背景移除(0 credits)、AI 背景生成、物体擦除、照片修复等功能完善
局限性与风险
- 商业模型依赖:作为第三方聚合平台,底层模型(如 Sora、Veo)的实际可用性受上游供应商制约
- 成本波动:高端模型如
flux-2-pro(15 credits)、wan-2-6-t2v(29 credits)及 OpenAI Sora-2(50+ credits)成本较高 - 异步状态缺失:文档未明确说明视频生成的异步轮询机制,可能需自行处理长时任务
- 地区合规未知:未披露数据存储位置、GDPR/CCPA 合规状态及内容审核策略
适用人群
- 快速原型开发者:需一站式接入多模型对比测试
- 电商/营销团队:高频使用背景移除、虚拟试衣、AI 背景生成等编辑功能
- 内容创作者:需要 Kling、Veo、Sora 等高质量视频模型,且愿接受按需付费模式
安全建议
- API Key 严格通过环境变量注入,避免硬编码
- 生产环境建议配置用量告警,防止 credits 意外耗尽(402 错误)
- 用户上传图片需预先审查,避免敏感内容触发平台合规封禁