核心用法
best-image-generation 是一个调用 EvoLink Nano Banana Pro (gemini-3-pro-image-preview) 模型的图像生成技能,通过 REST API 实现:
- 文生图:直接输入 prompt,指定尺寸(auto/1:1/16:9 等)和画质(1K/2K/4K)
- 图生图/编辑:提供最多 10 张参考图片 URL(≤10MB,jpg/png/webp),结合 prompt 进行重绘或编辑
- 异步工作流:提交任务 → 轮询状态(每10秒,最多12分钟)→ 下载结果
关键参数
| 参数 | 说明 |
|------|------|
| `size` | 支持 11 种比例,auto 自适应 |
| `quality` | 2K 默认,4K 额外计费 |
| `image_urls` | 图生图时最多 10 张参考图 |
输出文件自动保存为 evolink-<时间戳>.<格式>,并打印 MEDIA:<路径> 供 OpenClaw 自动附加。
显著优点
1. 性价比突出:单张 $0.12-0.20,低于 Midjourney/DALL-E 3 等主流服务
2. 多模态支持:原生支持文本+图像混合输入,编辑场景灵活
3. 高分辨率选项:最高 4K 输出,满足印刷级需求
4. 零依赖实现:提供 Python/PowerShell/curl 多平台参考代码
5. OC 生态集成:MEDIA: 协议自动触发附件上传,无额外开发
潜在缺点与局限
- 异步延迟:必须轮询等待,最坏情况 12 分钟,不适合实时交互
- URL 依赖:图生图需用户提前上传图片获取 URL,增加使用门槛
- 成本浮动:4K 画质未明确标价,存在超额计费风险
- 服务商单一:深度绑定 EvoLink,无备用 API 切换机制
- 24h 链接有效期:虽然本地文件持久保存,但原始 URL 短期失效可能影响复核
适合人群
- 内容创作者/设计师:需要批量生成高质量概念图、产品图
- 开发者:集成图像生成能力到自有工作流
- 成本敏感用户:追求 Stable Diffusion 级质量但不愿自建 GPU 集群
常规风险
| 风险类型 | 说明 |
|----------|------|
| API 密钥泄露 | `EVOLINK_API_KEY` 需妥善保管,建议配合密钥管理服务 |
| 内容合规 | 需遵守 EvoLink 平台的内容政策,NSFW/侵权内容可能导致封号 |
| 费用失控 | 4K 选项和大量调用可能产生意外账单,建议设置用量告警 |
| 服务可用性 | 轮询机制依赖 EvoLink 服务端稳定性,超时需优雅降级 |