核心用法
Nano Banana Pro 是一个封装了 Gemini Image API 的图像生成工具,通过 uv run 运行 Python 脚本实现文生图和图生图功能。
基础命令结构:
- 文生图:
uv run {baseDir}/scripts/generate_image.py --prompt "描述" --filename "输出.png" --resolution 1K - 图生图:
uv run ... -i "/路径/输入.png" - 多图合成:支持最多 14 张输入图像,通过多个
-i参数串联
关键特性:
1. 自动模型降级:当首选模型 gemini-2.5-flash-image 失败时,自动回退至 gemini-2.0-flash-exp-image-generation
2. 分辨率选项:1K(默认)、2K、4K
3. OpenClaw 集成:输出 MEDIA: 标记行,支持自动附件上传
配置方式:
- 环境变量:
GEMINI_API_KEY - 配置文件:
~/.openclaw/openclaw.json中的技能专属配置
显著优点
- 部署极简:依赖
uv单二进制工具,无需手动管理 Python 虚拟环境 - 容错性强:内置多模型 fallback 机制,提升服务可用性
- 多图能力:支持高达 14 张图像的复杂合成场景
- 输出规范:强制时间戳命名,自动生成可解析的媒体标记
局限性与风险
| 维度 | 说明 |
|------|------|
| 运行方式约束 | 必须使用 `uv run`,直接使用 `python3` 会导致依赖缺失 |
| 平台锁定 | 主要针对 OpenClaw 生态优化,其他环境需手动适配 |
| 模型依赖 | 完全依赖 Google Gemini API,存在服务商策略变更风险 |
| 无安全审计 | 配套报告为占位生成,未经实际安全扫描 |
| 隐私考量 | 图像数据需上传至 Google 云端处理 |
适合人群
- OpenClaw/Ching-Tech OS 平台用户
- 需要快速原型设计的开发者
- 追求"零配置"图像生成工作流的自动化用户
常规风险提示
- API 密钥需妥善保管,避免硬编码提交
- 高分辨率(4K)生成可能消耗更多 token 配额
- 多图合成场景建议预先验证输入图像格式兼容性