使用说明

核心用法

Nano Banana Pro 是一款命令行驱动的 AI 图像处理工具，深度集成 Google Gemini 图像生成模型。其核心功能涵盖四大场景：

1. 文生图：通过 --prompt 参数直接生成图像，支持 1K/2K/4K 三种分辨率输出
2. 图生图编辑：单张图像的智能编辑与重绘，保持主体一致性
3. 多图合成：最多支持 14 张输入图像的融合创作，适用于复杂场景构建
4. 图像修复：内置 restore 模式用于老照片修复、画质增强，支持自定义修复指令

技术实现上采用自动模型降级机制：优先调用 gemini-2.5-flash-image，失败时无缝切换至 gemini-2.0-flash-exp-image-generation，可通过环境变量 NANOBANANA_FALLBACK_MODELS 自定义降级链。

显著优点

开箱即用：基于 uv 构建，单 Python 脚本部署，依赖极简
生态集成：原生适配 OpenClaw 平台，输出 MEDIA: 标记实现自动文件挂载
灵活配置：API Key 支持环境变量、JSON 配置文件双重注入方式
批量友好：多图输入采用重复 -i 参数设计，契合 Unix 管道哲学

潜在局限

平台锁定：核心针对 OpenClaw/CTOS 生态优化，跨平台移植需手动适配
模型黑盒：依赖 Google 闭源 Gemini 模型，生成结果不可控，存在政策审查风险
无本地 fallback：完全依赖云端 API，网络中断即服务不可用
分辨率阶梯粗糙：仅三档固定分辨率，无法精细控制输出尺寸

适合人群

需要快速生成/修复图像的开发者与内容创作者
OpenClaw 生态深度用户
熟悉命令行工作流的技术人员

常规风险

API 密钥泄露：GEMINI_API_KEY 以明文形式存储于环境变量或 JSON 配置，多用户环境存在横向泄露风险
输出不可审计：AI 生成图像可能包含版权争议元素或不当内容，无内置审核机制
模型迭代断裂：Gemini 实验性模型（flash-exp）可能随时下线或变更接口，导致工具失效

ai-image-generation gemini-api image-editing image-restoration multimodal-ai cli-tool openclaw

Nanobanana Pro 内容

scripts文件夹

手动下载zip · 3.8 kB

generate.pytext/plain

请选择文件