Nanobanana Pro

🍌 Gemini 驱动的智能图像工坊

基于 Gemini 多模态模型的 AI 图像生成与修复工具,支持自动模型降级与多图合成。

收藏
10.6k
安装
2.6k
版本
0.3.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

Nano Banana Pro 是一款命令行驱动的 AI 图像处理工具,深度集成 Google Gemini 图像生成模型。其核心功能涵盖四大场景:

1. 文生图:通过 --prompt 参数直接生成图像,支持 1K/2K/4K 三种分辨率输出
2. 图生图编辑:单张图像的智能编辑与重绘,保持主体一致性

3. 多图合成:最多支持 14 张输入图像的融合创作,适用于复杂场景构建

4. 图像修复:内置 restore 模式用于老照片修复、画质增强,支持自定义修复指令

技术实现上采用自动模型降级机制:优先调用 gemini-2.5-flash-image,失败时无缝切换至 gemini-2.0-flash-exp-image-generation,可通过环境变量 NANOBANANA_FALLBACK_MODELS 自定义降级链。

显著优点

  • 开箱即用:基于 uv 构建,单 Python 脚本部署,依赖极简
  • 生态集成:原生适配 OpenClaw 平台,输出 MEDIA: 标记实现自动文件挂载
  • 灵活配置:API Key 支持环境变量、JSON 配置文件双重注入方式
  • 批量友好:多图输入采用重复 -i 参数设计,契合 Unix 管道哲学

潜在局限

  • 平台锁定:核心针对 OpenClaw/CTOS 生态优化,跨平台移植需手动适配
  • 模型黑盒:依赖 Google 闭源 Gemini 模型,生成结果不可控,存在政策审查风险
  • 无本地 fallback:完全依赖云端 API,网络中断即服务不可用
  • 分辨率阶梯粗糙:仅三档固定分辨率,无法精细控制输出尺寸

适合人群

  • 需要快速生成/修复图像的开发者与内容创作者
  • OpenClaw 生态深度用户
  • 熟悉命令行工作流的技术人员

常规风险

  • API 密钥泄露GEMINI_API_KEY 以明文形式存储于环境变量或 JSON 配置,多用户环境存在横向泄露风险
  • 输出不可审计:AI 生成图像可能包含版权争议元素或不当内容,无内置审核机制
  • 模型迭代断裂:Gemini 实验性模型(flash-exp)可能随时下线或变更接口,导致工具失效

Nanobanana Pro 内容

scripts文件夹
手动下载zip · 3.8 kB
generate.pytext/plain
请选择文件