Nanobanana Pro

🍌 Gemini 驱动的智能图像生成器

media-generation榜 #14

基于 Gemini Image API 的图像生成与编辑工具,支持自动模型降级和多图合成,最高输出 4K 分辨率。

收藏
12.8k
安装
2.6k
版本
0.4.3
CLS 安全性认证2026-06-03
点击查看完整报告 >

使用说明

核心用法

Nano Banana Pro 是一个封装了 Gemini Image API 的图像生成工具,通过 uv run 运行 Python 脚本实现文生图和图生图功能。

基础命令结构:

  • 文生图:uv run {baseDir}/scripts/generate_image.py --prompt "描述" --filename "输出.png" --resolution 1K
  • 图生图:uv run ... -i "/路径/输入.png"
  • 多图合成:支持最多 14 张输入图像,通过多个 -i 参数串联

关键特性:
1. 自动模型降级:当首选模型 gemini-2.5-flash-image 失败时,自动回退至 gemini-2.0-flash-exp-image-generation

2. 分辨率选项:1K(默认)、2K、4K

3. OpenClaw 集成:输出 MEDIA: 标记行,支持自动附件上传

配置方式:

  • 环境变量:GEMINI_API_KEY
  • 配置文件:~/.openclaw/openclaw.json 中的技能专属配置

显著优点

  • 部署极简:依赖 uv 单二进制工具,无需手动管理 Python 虚拟环境
  • 容错性强:内置多模型 fallback 机制,提升服务可用性
  • 多图能力:支持高达 14 张图像的复杂合成场景
  • 输出规范:强制时间戳命名,自动生成可解析的媒体标记

局限性与风险

| 维度 | 说明 |
|------|------|
| 运行方式约束 | 必须使用 `uv run`,直接使用 `python3` 会导致依赖缺失 |
| 平台锁定 | 主要针对 OpenClaw 生态优化,其他环境需手动适配 |
| 模型依赖 | 完全依赖 Google Gemini API,存在服务商策略变更风险 |
| 无安全审计 | 配套报告为占位生成,未经实际安全扫描 |
| 隐私考量 | 图像数据需上传至 Google 云端处理 |

适合人群

  • OpenClaw/Ching-Tech OS 平台用户
  • 需要快速原型设计的开发者
  • 追求"零配置"图像生成工作流的自动化用户

常规风险提示

  • API 密钥需妥善保管,避免硬编码提交
  • 高分辨率(4K)生成可能消耗更多 token 配额
  • 多图合成场景建议预先验证输入图像格式兼容性

安全解读

核心用法

Nano Banana Pro 是一个围绕 Google Gemini Image API 构建的图像生成与编辑工具,提供 Python 脚本封装与便捷 wrapper 两种调用方式。核心功能包括:

  • 文生图:通过 --prompt 描述生成图像,支持 1K/2K/4K 三种分辨率
  • 图生图:使用 -i 参数传入单张或多达 14 张参考图进行编辑或合成
  • 自动模型回退:默认按 gemini-2.5-flash-imagegemini-2.0-flash-exp-image-generation 顺序尝试,失败自动切换,可通过 NANOBANANA_FALLBACK_MODELS 自定义链

运行必须依赖 uv 工具链执行(uv run),确保依赖隔离;直接 python3 调用将因缺少依赖而失败。

显著优点

1. 稳定性设计:模型自动回退机制显著降低单点故障风险,适合自动化工作流
2. 功能完整:覆盖生成、编辑、多图合成三大场景,分辨率选择灵活

3. 生态集成:输出自动打印 MEDIA: 行,便于 OpenClaw 等环境自动附加结果

4. 配置灵活:API 密钥支持环境变量、skill 配置文件等多渠道配置

5. 安全基线高:无硬编码密钥,依赖均为官方/主流库

潜在局限

  • 平台依赖:必须预装 uv,对纯 Python 环境用户增加学习成本
  • API 成本:依赖 Google Gemini API,高频使用产生调用费用
  • 模型黑盒:Gemini 图像模型的具体能力与限制由 Google 控制,更新可能带来行为变化
  • 无本地模型:必须联网,无法离线运行
  • 单文件输出:多图合成最终输出单张,不提供中间过程控制

适合人群

  • 需要稳定、可编程图像生成的开发者与创作者
  • 已使用 OpenClaw/Ching-Tech-OS 生态的用户
  • 愿意承担 API 成本以换取云端模型能力的场景

常规风险

| 风险类型 | 说明 | 缓解措施 |
|---------|------|---------|
| API 密钥泄露 | 环境变量配置不当可能导致密钥暴露 | 使用 `.env` 文件并加入 `.gitignore`,定期轮换密钥 |
| 文件覆盖 | 输出路径未经验证,可能意外覆盖系统文件 | 使用含时间戳的命名规范(如 `yyyy-mm-dd-hh-mm-ss-name.png`) |
| 依赖供应链 | `>=` 版本范围可能引入恶意更新 | 关注上游更新,考虑锁定版本或使用 `uv.lock` |
| 内容合规 | 生成内容受 Gemini API 使用政策约束 | 遵守 Google 服务条款,避免生成违规内容 |

Nanobanana Pro 内容

scripts文件夹
手动下载zip · 4.3 kB
generate_image.pytext/plain
请选择文件