🫧 Nano Banana Edit — Pro Pack on RunComfy

🫧 批量图像编辑,主体身份精准保留

Google Nano Banana 2 图像编辑端点,支持批量处理20张图像,擅长保留主体身份、背景替换与空间定位编辑,通过 RunComfy CLI 调用。

收藏
7.6k
安装
2.7k
版本
0.1.1
CLS 安全性认证2026-06-04
点击查看完整报告 >

使用说明

核心用法

Nano Banana Edit 是 Google Gemini 系列轻量级图像模型 Nano Banana 2 的图生图编辑端点,托管于 RunComfy Model API。该技能通过 runcomfy run google/nano-banana-2/edit 命令调用,支持 1-20 张输入图像的批量编辑,单次可生成 1-4 张输出。

关键能力:

  • 主体身份保留:在背景替换、服装更换等场景中保持人物/产品特征不变
  • 空间定位编辑:通过 "leftmost object only"、"upper-right corner" 等空间语言精确控制编辑范围
  • 批量一致性处理:锁定 aspect_ratioresolution 参数,确保系列图像风格统一

提示工程要点:采用 "保留优先,变更置后" 结构,先声明需保持不变的元素,再说明修改内容。避免长复合指令,多步骤编辑建议拆分为多次调用。

显著优点

| 优势 | 说明 |
|------|------|
| 批量处理能力 | 单次最多处理20张输入图像,适合SKU图库、广告创意A/B测试 |
| 身份保持强度高 | 在背景替换任务中优于同类轻量模型 |
| 空间语义理解准确 | "X only" 类定位指令执行可靠 |
| 分辨率灵活 | 支持 0.5K/1K/2K/4K 四档输出 |
| CLI 集成简洁 | 单一命令完成提交-轮询-下载全流程 |

潜在局限

  • 复合指令漂移:多目标同时编辑时易产生非预期变化,需分步执行
  • 多语言文本编辑弱势:图像内文字编辑(招牌、标签)建议改用 GPT Image 2 edit
  • 精确局部操控不足:"手持某物" 类精细编辑建议选用 Flux Kontext
  • 首图权重不均:多图输入时仅首张作为主参考,其余仅提供辅助线索
  • Web搜索附加成本enable_web_search 会增加延迟和费用

适合人群

  • 电商运营:需批量生成同产品多背景SKU图
  • 广告创意团队:A/B测试素材快速迭代
  • 内容创作者:社交媒体头像/封面背景替换
  • 品牌设计:资产本地化(色彩/文字替换)

常规风险

  • API令牌管理~/.config/runcomfy/token.json 存储敏感凭证,需确保权限 0600
  • 外部URL风险:图像URL由 RunComfy 服务器抓取,存在图像提示注入可能
  • 输出体积控制:CLI 单文件下载上限 2GiB,防止恶意输出占满磁盘
  • 成本累积:高分辨率 + 多图批量 + Web搜索组合下费用上升较快

安全解读

核心用法

Nano Banana Edit 是 Google Gemini 家族 Flash 级图像模型的图像到图像编辑端点,托管于 RunComfy Model API。核心价值在于主体身份保留——在修改背景、服装或局部元素时,稳定保持人物/产品的面部特征、姿态和品牌识别度。

典型调用场景

  • 背景替换:保持主体不变,将背景转换为赛博朋克街景、工作室布景等
  • 批量处理:单次最多20张输入图,适合SKU图库、广告素材变体生成
  • 局部编辑:通过空间语言精确定位("仅左侧物体"、"右下角水印")
  • A/B测试:锁定seed和分辨率,生成一致性变体

显著优点

  • 身份保真度强:相比通用编辑模型,Nano Banana 2 在面部/品牌保留上表现更稳
  • 批量效率高:20图并行处理,电商场景友好
  • 空间理解准:"leftmost object only" 类指令执行可靠
  • Prompt工程友好:明确的前置保留声明("Keep...unchanged")能被模型严格遵守

潜在局限

  • 复合指令漂移:多目标同时修改("改A又改B又改C")易导致不可控变化,建议拆分为多轮
  • 多语言文字编辑弱:图中文字替换(如中文招牌)建议使用 GPT Image 2 edit
  • 精确定位编辑:"让她手持某物"类指令不如 Flux Kontext 精准
  • 依赖外部CLI:需安装 @runcomfy/cli 并配置 API Token

适合人群

  • 电商运营:快速生成统一主体的多背景SKU图
  • 广告设计师:批量产出A/B测试素材
  • 内容创作者:人物照片背景替换、风格迁移
  • 品牌方:保持logo/产品识别度的视觉变体制作

常规风险

  • URL安全风险:输入图像URL由RunComfy服务器抓取,需确保来源可信
  • Token管理RUNCOMFY_TOKEN 需妥善保管,避免泄露至版本控制
  • 输出目录权限:确保 --output-dir 指向非系统敏感路径
  • 成本累积:高分辨率(4K)+ 批量处理 + 启用web搜索会显著增加费用

最佳实践摘要

前置保留声明 → 单一修改目标 → 空间语言限定 → 锁定宽高比/分辨率 → 必要时拆分为多轮迭代。

🫧 Nano Banana Edit — Pro Pack on RunComfy 内容

手动下载zip · 4.1 kB
SKILL.mdtext/markdown
请选择文件