核心用法
Nano Banana Edit 是 Google Gemini 系列轻量级图像模型 Nano Banana 2 的图生图编辑端点,托管于 RunComfy Model API。该技能通过 runcomfy run google/nano-banana-2/edit 命令调用,支持 1-20 张输入图像的批量编辑,单次可生成 1-4 张输出。
关键能力:
- 主体身份保留:在背景替换、服装更换等场景中保持人物/产品特征不变
- 空间定位编辑:通过 "leftmost object only"、"upper-right corner" 等空间语言精确控制编辑范围
- 批量一致性处理:锁定
aspect_ratio和resolution参数,确保系列图像风格统一
提示工程要点:采用 "保留优先,变更置后" 结构,先声明需保持不变的元素,再说明修改内容。避免长复合指令,多步骤编辑建议拆分为多次调用。
显著优点
| 优势 | 说明 |
|------|------|
| 批量处理能力 | 单次最多处理20张输入图像,适合SKU图库、广告创意A/B测试 |
| 身份保持强度高 | 在背景替换任务中优于同类轻量模型 |
| 空间语义理解准确 | "X only" 类定位指令执行可靠 |
| 分辨率灵活 | 支持 0.5K/1K/2K/4K 四档输出 |
| CLI 集成简洁 | 单一命令完成提交-轮询-下载全流程 |
潜在局限
- 复合指令漂移:多目标同时编辑时易产生非预期变化,需分步执行
- 多语言文本编辑弱势:图像内文字编辑(招牌、标签)建议改用 GPT Image 2 edit
- 精确局部操控不足:"手持某物" 类精细编辑建议选用 Flux Kontext
- 首图权重不均:多图输入时仅首张作为主参考,其余仅提供辅助线索
- Web搜索附加成本:
enable_web_search会增加延迟和费用
适合人群
- 电商运营:需批量生成同产品多背景SKU图
- 广告创意团队:A/B测试素材快速迭代
- 内容创作者:社交媒体头像/封面背景替换
- 品牌设计:资产本地化(色彩/文字替换)
常规风险
- API令牌管理:
~/.config/runcomfy/token.json存储敏感凭证,需确保权限 0600 - 外部URL风险:图像URL由 RunComfy 服务器抓取,存在图像提示注入可能
- 输出体积控制:CLI 单文件下载上限 2GiB,防止恶意输出占满磁盘
- 成本累积:高分辨率 + 多图批量 + Web搜索组合下费用上升较快