核心用法
Yollomi AI API 是一个多模型聚合的生成式AI平台,通过单一REST端点 POST /api/v1/generate 提供图像与视频生成能力。开发者只需替换 modelId 参数即可切换底层模型,无需适配不同厂商的API规范。
图像生成流程:设置 YOLLOMI_API_KEY → 调用 /api/v1/models 获取可用模型 → 选择 modelId(如 flux、imagen-4-ultra)→ 提交prompt与 aspectRatio(1:1/16:9/9:16)→ 获取图片URL数组。
进阶功能覆盖:背景移除(remove-bg,0积分)、图像修复(photo-restoration)、智能扩图(image-upscaler)、虚拟试穿(virtual-try-on)、人脸替换(face-swap)、对象擦除(object-remover)及Qwen图像编辑等,形成完整视觉工作流。
视频生成:支持OpenAI Sora 2、Google Veo 3系列、Kling 2.1、Runway Gen4、MiniMax Hailuo等主流模型,计费从7-50+积分不等,当前版本视频功能已临时禁用。
显著优点
- 统一接口,降低集成成本:单一端点替代多家厂商SDK,切换模型仅改参数
- 模型覆盖全面:图像涵盖Flux全系列、Stable Diffusion 3.5、Google Imagen 4、Ideogram V3等;视频聚合Sora、Veo、Kling等一线模型
- 精细化计费:图像1-15积分/张,视频7-50+积分,支持按需成本控制
- 实用工具链:0积分背景移除、1积分超分等低价高频功能完善
潜在局限
- 视频功能不稳定:当前构建版本已禁用视频生成,生产环境需确认可用性
- 生态封闭性:相比直接使用OpenAI、Google等官方API,Yollomi作为中间层存在单点故障风险
- 文档深度不足:部分模型参数细节需依赖外部
models-reference.md或运行时查询 - 成本不透明:Runway Gen4等模型标注"varies",缺乏固定定价
适合人群
- 需快速对比多模型效果的AI应用开发者
- 追求单一账单管理的中小团队
- 需要图像后处理工具链(去背、修复、扩图)的内容创作者
- 积分预算敏感、希望精细控制生成成本的用户
常规风险
| 风险类型 | 说明 |
|---------|------|
| 密钥泄露 | API Key需环境变量管理,硬编码存在被盗刷积分风险 |
| 服务中断 | 聚合层故障将导致所有模型不可用,建议保留官方API兜底方案 |
| 内容安全 | 生成内容需自行合规审核,平台可能因违规内容封禁账户 |
| 积分耗尽 | 402错误需及时充值,高消耗模型(如Sora 50+积分)易触发余额不足 |