Yollomi AI Image & Video Generator

🎨 一站式 AI 图像视频生成平台

ai-multimodal榜 #1

Yollomi API 统一接口生成 AI 图像与视频,覆盖 Flux、Sora、Veo、Kling 等主流模型,支持文生图、背景移除、视频生成等多元功能。

收藏
11k
安装
2.5k
版本
1.0.1
CLS 安全性认证2026-05-18
点击查看完整报告 >

使用说明

核心功能与用法

Yollomi AI API 是一个统一端点的图像与视频生成服务,通过 POST /api/v1/generate 单一接口调用 20+ 图像模型和 15+ 视频模型,包括 Flux 系列、Google Veo-3、OpenAI Sora-2、Kling、Runway Gen4 等主流方案。

核心工作流

  • 图像生成:设置 type: "image",选择 modelId(如 fluximagen-4-ultra),提供 prompt 和 aspectRatio(1:1/16:9/9:16)
  • 视频生成:设置 type: "video",选择视频模型(如 kling-2-1google-veo-3),提供 prompt 和可选输入帧
  • 编辑处理:支持背景移除(remove-bg)、换脸(face-swap)、图像超分(image-upscaler)、老照片修复(photo-restoration)、虚拟试衣(virtual-try-on)等

认证方式Authorization: BearerX-API-Key 头,需配置 YOLLOMI_API_KEY 环境变量。

显著优势

1. 统一接口设计:所有模型共用 /api/v1/generate 端点,降低集成复杂度
2. 模型覆盖全面:集成文本生成图像(Flux/SD 3.5/Imagen)、视频生成(Sora/Veo/Kling/Runway)、图像编辑三大品类

3. 按需计费透明:图像 0-15 credits/张,视频 7-50+ credits/条,支持 remainingCredits 实时余额查询

4. 实用编辑工具链:免费背景移除(0 credits)、AI 背景生成、物体擦除、照片修复等功能完善

局限性与风险

  • 商业模型依赖:作为第三方聚合平台,底层模型(如 Sora、Veo)的实际可用性受上游供应商制约
  • 成本波动:高端模型如 flux-2-pro(15 credits)、wan-2-6-t2v(29 credits)及 OpenAI Sora-2(50+ credits)成本较高
  • 异步状态缺失:文档未明确说明视频生成的异步轮询机制,可能需自行处理长时任务
  • 地区合规未知:未披露数据存储位置、GDPR/CCPA 合规状态及内容审核策略

适用人群

  • 快速原型开发者:需一站式接入多模型对比测试
  • 电商/营销团队:高频使用背景移除、虚拟试衣、AI 背景生成等编辑功能
  • 内容创作者:需要 Kling、Veo、Sora 等高质量视频模型,且愿接受按需付费模式

安全建议

  • API Key 严格通过环境变量注入,避免硬编码
  • 生产环境建议配置用量告警,防止 credits 意外耗尽(402 错误)
  • 用户上传图片需预先审查,避免敏感内容触发平台合规封禁

安全解读

核心用法

Yollomi AI API Skill 是一个纯文档型 API 封装工具,通过单一统一端点 /api/v1/generate 调用 Yollomi 平台的 AI 生成服务。支持文本生成图像(Flux、Imagen、Ideogram 等)、背景移除、图像编辑(换脸、修复、扩图)、以及视频生成(Sora、Kling、Veo、Runway 等)三大类能力。

用户需提供 YOLLOMI_API_KEY 环境变量,通过 POST 请求指定 type(image/video)和 modelId 即可调用。图像生成支持 1:1、16:9、9:16 等比例;视频生成支持文生视频和图生视频模式。 credits 消耗从 0(背景移除)到 50+(Sora 2)不等,价格透明。

显著优点

1. 统一端点设计:所有模型共享同一个 /api/v1/generate 端点,大幅降低集成复杂度,无需为不同模型维护多套路由。
2. 模型生态丰富:覆盖 20+ 图像模型(Flux 系列、Stable Diffusion 3.5、Imagen-4、Seedream 等)和 15+ 视频模型(OpenAI Sora、Google Veo、Kling、Runway Gen-4 等),满足从快速原型到高端生产的分层需求。

3. 功能边界清晰:文生图、图生图、图生视频、视频生成、图像编辑五大场景全部覆盖,且参数文档完整,开发者可按表选用。

4. 成本可控:credits 定价公开(如 Flux Schnell 仅 2 credits/张,Veo-3-Fast 仅 9 credits/视频),便于预算规划。

潜在缺点与局限性

1. 外部依赖风险:核心功能完全依赖 Yollomi 第三方服务(yollomi.com),服务可用性、数据隐私政策、长期商业稳定性均由外部决定,Skill 本身无降级或本地 fallback 能力。
2. T3 来源可信度:作者为个人开发者(anichikage),无企业级背书,需用户自行承担供应链风险。

3. API Key 管理负担:用户需自行获取、安全存储和轮换 API Key,Skill 不提供密钥托管或权限细粒度控制。

4. 无代码执行能力:纯文档型 Skill,不包含实际可执行代码,需开发者自行实现 HTTP 客户端逻辑。

5. 数据传输警告:所有提示词、图片 URL 均上传至 Yollomi 服务器,存在潜在的隐私泄露和模型训练数据化风险,不适合处理敏感或机密内容。

适合人群

  • AI 应用开发者:需要快速集成多模型图像/视频生成能力的原型开发阶段。
  • 内容创作者工具链:为设计、营销、社交媒体运营场景构建自动化工作流。
  • 低代码/无代码平台:作为 API 文档参考,封装成可视化节点或插件。
  • 接受外部 API 模式的团队:明确知晓并愿意承担第三方 SaaS 风险的中低风险场景。

常规风险

  • 服务中断:Yollomi 服务宕机或 API 变更将直接导致 Skill 失效。
  • 数据隐私:用户输入的提示词、图片 URL 可能被 Yollomi 记录或用于模型改进,敏感内容外泄风险。
  • 成本失控:视频模型(尤其 Sora 2)credits 消耗较高,高频调用易产生意外账单。
  • 密钥泄露:API Key 以环境变量形式管理,不当存储(如提交至 GitHub)将导致密钥泄露和滥用。

Yollomi AI Image & Video Generator 内容

scripts文件夹
手动下载zip · 4.7 kB
test-api.shtext/x-shellscript
请选择文件