Nanobanana Pro

🍌 AI 图像生成·智能模型降级

creative榜 #32

基于 Gemini Image API 的图像生成与编辑工具,支持多模型自动降级和多图合成,需自行配置 API 密钥。

收藏
9k
安装
2.6k
版本
0.4.0
CLS 安全性认证2026-05-13
点击查看完整报告 >

使用说明

核心用法

Nano Banana Pro 是一款基于 Gemini Image API 的图像生成与编辑命令行工具,通过 Python 脚本封装实现。主要功能包括:

  • 文生图:通过 --prompt 描述生成图像,支持 1K/2K/4K 三种分辨率
  • 图生图编辑:传入单张图片配合编辑指令进行局部或风格修改
  • 多图合成:最多支持 14 张图片作为输入,实现场景融合或拼贴创作

典型工作流:编写自然语言提示词 → 指定输出文件名(建议带时间戳格式 yyyy-mm-dd-hh-mm-ss-name.png)→ 脚本自动调用 API 并保存结果。成功执行后会输出 MEDIA: 标记行,便于 OpenClaw 等客户端自动识别并附加媒体文件。

API 密钥配置灵活,支持环境变量 GEMINI_API_KEY 或 OpenClaw 配置文件中的 skills."nanobanana-pro-fallback".apiKey 字段。

显著优点

1. 模型自动降级:默认优先尝试 gemini-2.5-flash-image,失败自动回退至 gemini-2.0-flash-exp-image-generation,可通过 NANOBANANA_FALLBACK_MODELS 自定义降级链路
2. 多分辨率输出:从 1K 到 4K 可选,适配不同场景对画质与速度的需求

3. 批量多图输入:相比同类工具通常仅支持单图参考,14 张上限为多元素复杂构图提供便利

4. 零依赖部署:通过 uv 运行时即时获取依赖,无需预装复杂 Python 环境

潜在缺点与局限性

  • 外部 API 依赖:完全依托 Google Gemini 服务,网络稳定性、区域可用性及 API 配额直接影响使用体验
  • 密钥管理风险:需用户自行保管 GEMINI_API_KEY,误配置或泄露可能导致配额滥用
  • 输出可控性有限:提示词遵循与图像质量受 Gemini 模型版本迭代影响,不同模型间风格可能存在漂移
  • 无本地预览:脚本执行后仅返回保存路径,不自动读取图像内容供确认,需手动打开查看

适合人群

  • 已拥有 Gemini API 访问权限的开发者与创作者
  • 需要在 CLI/自动化工作流中集成图像生成的效率用户
  • 对多图参考、高分辨率输出有明确需求的设计师

常规风险

  • 配额与计费:Gemini 图像生成 API 可能按调用量计费,高频或高分辨率请求需关注成本控制
  • 内容安全合规:生成内容受 Google 使用政策约束,存在被拦截或账号限制的可能性
  • 模型可用性:实验性模型(如 gemini-2.0-flash-exp-image-generation)可能随时调整或下线
  • 路径与权限:多图合成时输入路径需确保可读,输出目录需写入权限

安全解读

核心用法

Nano Banana Pro 是一款面向 OpenClaw 和 Ching-Tech OS 平台的图像生成 Skill,通过调用 Google Gemini Image API 实现文生图、图生图及多图合成。用户通过简单的命令行参数即可控制输出:

  • 文生图--prompt 描述画面,--filename 指定输出路径,--resolution 选择 1K/2K/4K 分辨率
  • 图生图/编辑:添加 -i 参数传入单张图片,配合 prompt 进行风格转换或局部修改
  • 多图合成:支持最多 14 张图片输入,自动融合为统一场景

脚本内置自动降级机制:当 gemini-2.5-flash-image 不可用时,自动切换至 gemini-2.0-flash-exp-image-generation,可通过环境变量 NANOBANANA_FALLBACK_MODELS 自定义降级顺序。输出完成后打印 MEDIA: 标记,便于 OpenClaw 自动附加到对话流中。

显著优点

1. 零配置开箱即用:依赖 uv 单文件运行,无需复杂 Python 环境搭建
2. 企业级模型兜底:自动降级策略确保服务连续性,避免单点故障

3. 多分辨率支持:从快速预览(1K)到印刷级输出(4K)全覆盖

4. 生态集成友好:原生支持 OpenClaw 的媒体协议,自动关联聊天上下文

潜在缺点与局限性

  • 来源可信度受限:作者为个人开发者(yazelin),无企业背书,属 T3 来源等级
  • 隐私数据出境:所有 prompts 和上传图片均发送至 Google 服务器,存在合规考量
  • 路径遍历风险--filename 参数未严格校验,理论上可写入任意系统路径
  • 无本地模型支持:完全依赖云端 API,离线不可用且受配额限制

适合人群

  • 需要快速生成概念图的产品经理与设计师
  • 构建 AI 工作流的开发者(尤其 OpenClaw 用户)
  • 对 Gemini 生态有偏好的个人创作者

常规风险

  • API 密钥泄露:需妥善保管 GEMINI_API_KEY,避免硬编码提交至版本控制
  • 内容审核不可控:Google 可能对特定 prompt 返回拒绝响应,无本地申诉渠道
  • 成本累积:高分辨率(4K)与多图合成消耗较多 token,需监控用量
  • 输出覆盖风险:自动创建父目录的特性可能意外覆盖现有文件

Nanobanana Pro 内容

scripts文件夹
手动下载zip · 4.0 kB
generate_image.pytext/plain
请选择文件