核心用法
Nano Banana Pro 是一款命令行驱动的 AI 图像处理工具,深度集成 Google Gemini 图像生成模型。其核心功能涵盖四大场景:
1. 文生图:通过 --prompt 参数直接生成图像,支持 1K/2K/4K 三种分辨率输出
2. 图生图编辑:单张图像的智能编辑与重绘,保持主体一致性
3. 多图合成:最多支持 14 张输入图像的融合创作,适用于复杂场景构建
4. 图像修复:内置 restore 模式用于老照片修复、画质增强,支持自定义修复指令
技术实现上采用自动模型降级机制:优先调用 gemini-2.5-flash-image,失败时无缝切换至 gemini-2.0-flash-exp-image-generation,可通过环境变量 NANOBANANA_FALLBACK_MODELS 自定义降级链。
显著优点
- 开箱即用:基于
uv构建,单 Python 脚本部署,依赖极简 - 生态集成:原生适配 OpenClaw 平台,输出
MEDIA:标记实现自动文件挂载 - 灵活配置:API Key 支持环境变量、JSON 配置文件双重注入方式
- 批量友好:多图输入采用重复
-i参数设计,契合 Unix 管道哲学
潜在局限
- 平台锁定:核心针对 OpenClaw/CTOS 生态优化,跨平台移植需手动适配
- 模型黑盒:依赖 Google 闭源 Gemini 模型,生成结果不可控,存在政策审查风险
- 无本地 fallback:完全依赖云端 API,网络中断即服务不可用
- 分辨率阶梯粗糙:仅三档固定分辨率,无法精细控制输出尺寸
适合人群
- 需要快速生成/修复图像的开发者与内容创作者
- OpenClaw 生态深度用户
- 熟悉命令行工作流的技术人员
常规风险
- API 密钥泄露:
GEMINI_API_KEY以明文形式存储于环境变量或 JSON 配置,多用户环境存在横向泄露风险 - 输出不可审计:AI 生成图像可能包含版权争议元素或不当内容,无内置审核机制
- 模型迭代断裂:Gemini 实验性模型(
flash-exp)可能随时下线或变更接口,导致工具失效