核心用法
Yollomi AI API 是一个统一端点的多模态生成服务,通过单一 POST /api/v1/generate 接口支持图像生成、视频生成、背景移除、图像编辑等20余种功能。
关键调用模式:
- 文生图:指定
type: "image"+ 模型ID(如flux、flux-2-pro、imagen-4-ultra)+prompt+aspectRatio - 图生视频:指定
type: "video"+ 模型ID(如openai-sora-2、kling-2-1)+prompt,可选inputs上传参考图 - 图像编辑:支持背景移除(
remove-bg)、智能扩图(image-upscaler)、人脸替换(face-swap)、物体消除(object-remover)、老照片修复(photo-restoration)、虚拟试穿(virtual-try-on)等
认证方式:支持 Authorization: Bearer 或 X-API-Key 两种Header传参,需配置 YOLLOMI_API_KEY。
显著优点
1. 统一接口设计:所有模型共享同一端点,大幅降低集成复杂度
2. 模型覆盖全面:集成Flux全系列、OpenAI Sora 2、Google Veo 3、Kling 2.1、Runway Gen4、可灵、海螺等主流文生图/视频模型
3. 灵活的图像处理能力:除生成外,还提供8种专业图像编辑功能,覆盖常见电商和设计场景
4. 透明计费:按积分消耗计费(图像1-15积分/张,视频7-50+积分/条),剩余额度实时返回
5. 响应结构简洁:统一返回 images/video URL 数组 + remainingCredits,便于状态追踪
潜在缺点与局限性
1. 无本地部署选项:纯云服务,依赖网络稳定性和Yollomi平台可用性
2. 积分成本敏感:高端模型(如Sora 2、Wan 2.6)单次调用成本较高,大规模使用需预算规划
3. 模型参数差异大:不同模型支持的参数不统一(如 aspectRatio vs width/height),需查阅文档适配
4. 无内置重试/队列机制:文档未提及失败重试策略,需调用方自行实现容错
5. 隐私考量:图像/视频上传至第三方服务器,敏感内容需谨慎评估合规性
适合人群
- 独立开发者:快速原型验证,无需自建GPU基础设施
- 电商/设计团队:需要批量背景移除、商品图生成、虚拟试穿等自动化处理
- 内容创作者:集成AI视频生成到工作流,如短剧、广告素材制作
- SaaS产品:通过API为用户提供AI生成功能,按量计费模式便于成本转嫁
常规风险
- API密钥泄露:密钥硬编码或配置不当可能导致积分被盗刷
- 内容合规风险:AI生成内容的版权归属、有害内容过滤责任需用户自行承担
- 服务商依赖:平台政策变更、模型下线或价格调整可能影响业务连续性
- 积分耗尽导致服务中断:生产环境需监控
remainingCredits并设置预警