核心用法
best-image-generation 是基于 EvoLink Nano Banana Pro(gemini-3-pro-image-preview)模型的专业级图像生成技能,提供完整的文生图、图生图及图像编辑能力。
工作流三步骤:
1. 提交任务:通过 POST /images/generations 发送生成请求,支持文本描述、参考图片 URL(最多 10 张,单张 ≤10MB)
2. 轮询结果:每 10 秒查询 GET /tasks/{id},最长等待约 12 分钟
3. 下载输出:自动识别格式(PNG/JPG/WebP),本地保存为 evolink-<TIMESTAMP>.<ext>,并输出 MEDIA:<path> 供 OC 自动挂载
关键参数:
- 尺寸:支持 1:1 到 21:9 共 11 种比例,含自动适配
- 质量:1K / 2K(默认)/ 4K(额外计费)
- 触发指令:中文「高质量生图:xxx」「编辑图片:xxx」或英文「best image: xxx」「edit image: xxx」
参考实现:官方提供 Python(零依赖)、PowerShell 5.1+、curl+bash 三种跨平台方案。
显著优点
- 成本透明可控:单张 2K 图像约 $0.12-0.20,定价清晰
- 多模态能力:原生支持图像参考与编辑,非单纯文生图
- 分辨率灵活:最高 4K 可选,满足印刷级需求
- 输出自动化:自动格式识别 + OC 媒体挂载,集成零摩擦
- 多语言触发:中英双语指令,降低使用门槛
潜在局限
- 异步轮询设计:需客户端实现轮询逻辑,非即时响应(最长 12 分钟)
- API 依赖单一:绑定 EvoLink 生态,无备选供应商
- 4K 溢价计费:高分辨率需额外费用,预算敏感场景需权衡
- URL 有效期:生成链接约 24 小时过期,需及时下载或依赖本地持久化
适合人群
- 设计师/创作者:需要高质量可控生图与编辑的工作流
- 开发者:追求 API 简洁、多语言 SDK 支持的系统集成
- 内容运营:批量生成社交媒体配图、电商素材
- 对成本敏感的中度使用者:避开 Midjourney/Stable Diffusion 的自托管复杂度
常规风险
| 风险类型 | 说明 |
|---------|------|
| API 密钥安全 | `EVOLINK_API_KEY` 为唯一凭证,泄露可导致配额盗用 |
| 内容合规 | 生成内容受 EvoLink 服务条款约束,存在审核/封禁可能 |
| 成本失控 | 4K 质量与高频调用易超预算,需用量监控 |
| 服务连续性 | 第三方 API 存在停机或价格调整风险 |
| 版权模糊 | AI 生成图像版权归属因司法管辖区而异,商用需谨慎 |