使用说明

核心用法

Yollomi AI API 是一个统一端点的多模态生成服务，通过单一 POST /api/v1/generate 接口支持图像生成、视频生成、背景移除、图像编辑等20余种功能。

关键调用模式：

文生图：指定 type: "image" + 模型ID（如 flux、flux-2-pro、imagen-4-ultra）+ prompt + aspectRatio
图生视频：指定 type: "video" + 模型ID（如 openai-sora-2、kling-2-1）+ prompt，可选 inputs 上传参考图
图像编辑：支持背景移除（remove-bg）、智能扩图（image-upscaler）、人脸替换（face-swap）、物体消除（object-remover）、老照片修复（photo-restoration）、虚拟试穿（virtual-try-on）等

认证方式：支持 Authorization: Bearer 或 X-API-Key 两种Header传参，需配置 YOLLOMI_API_KEY。

显著优点

1. 统一接口设计：所有模型共享同一端点，大幅降低集成复杂度
2. 模型覆盖全面：集成Flux全系列、OpenAI Sora 2、Google Veo 3、Kling 2.1、Runway Gen4、可灵、海螺等主流文生图/视频模型
3. 灵活的图像处理能力：除生成外，还提供8种专业图像编辑功能，覆盖常见电商和设计场景
4. 透明计费：按积分消耗计费（图像1-15积分/张，视频7-50+积分/条），剩余额度实时返回
5. 响应结构简洁：统一返回 images/video URL 数组 + remainingCredits，便于状态追踪

潜在缺点与局限性

1. 无本地部署选项：纯云服务，依赖网络稳定性和Yollomi平台可用性
2. 积分成本敏感：高端模型（如Sora 2、Wan 2.6）单次调用成本较高，大规模使用需预算规划
3. 模型参数差异大：不同模型支持的参数不统一（如 aspectRatio vs width/height），需查阅文档适配
4. 无内置重试/队列机制：文档未提及失败重试策略，需调用方自行实现容错
5. 隐私考量：图像/视频上传至第三方服务器，敏感内容需谨慎评估合规性

适合人群

独立开发者：快速原型验证，无需自建GPU基础设施
电商/设计团队：需要批量背景移除、商品图生成、虚拟试穿等自动化处理
内容创作者：集成AI视频生成到工作流，如短剧、广告素材制作
SaaS产品：通过API为用户提供AI生成功能，按量计费模式便于成本转嫁

常规风险

API密钥泄露：密钥硬编码或配置不当可能导致积分被盗刷
内容合规风险：AI生成内容的版权归属、有害内容过滤责任需用户自行承担
服务商依赖：平台政策变更、模型下线或价格调整可能影响业务连续性
积分耗尽导致服务中断：生产环境需监控 remainingCredits 并设置预警

ai-image-generation ai-video-generation api flux sora kling image-editing background-removal multi-modal saas

Yollomi AI Image & Video Generator 内容

手动下载zip · 2.0 kB

SKILL.mdtext/markdown

请选择文件