Nanobanana Pro

🍌 Gemini 多模态图像生成专家

基于 Gemini Image API 的多模型自动回退图像生成工具,支持文生图与多图编辑,最高 4K 分辨率输出

收藏
10.7k
安装
2.6k
版本
0.4.4
CLS 安全性认证2026-05-17
点击查看完整报告 >

使用说明

Nano Banana Pro with Fallback 综合评估

核心用法

Nano Banana Pro 是一款封装了 Google Gemini Image API 的图像生成与编辑工具,专为 OpenClaw 和 Ching Tech OS 平台设计。用户通过 uv run 调用 Python 脚本,执行文本到图像(text-to-image)或图像到图像(image-to-image)任务。核心命令结构为:uv run {baseDir}/scripts/generate_image.py --prompt "描述" --filename "输出.png" [--resolution 1K|2K|4K] [-i 输入图.png]

关键特性包括:

  • 多模型自动回退:默认链路 gemini-2.5-flash-imagegemini-2.0-flash-exp-image-generation,任一模型失败时自动切换
  • 多图合成:支持最多 14 张输入图像进行复合编辑
  • 分辨率选择:1K(默认)、2K、4K 三档输出
  • 平台集成:输出 MEDIA: 标记供 OpenClaw 自动附加到聊天记录

显著优点

1. 零依赖管理:使用 uv 实现运行时依赖隔离,无需手动配置 Python 环境
2. 高可用性设计:模型回退机制显著提升任务成功率,避免单点故障

3. 多平台兼容:明确支持 OpenClaw 和 Ching Tech OS 双生态

4. 合规输出:自动生成平台识别的媒体标记,简化下游流程

潜在局限

  • 外部 API 依赖:完全依赖 Google Gemini 服务可用性与定价策略
  • 闭源后端:图像生成逻辑不可审计,存在模型行为不可控风险
  • 无本地模型选项:必须联网,无法离线使用
  • 分辨率上限:4K 为 Gemini API 当前上限,专业印刷场景可能不足

适合人群

  • 需要快速原型视觉内容的开发者与设计师
  • OpenClaw/Ching Tech OS 生态内的自动化工作流构建者
  • 对 Python 环境管理敏感、偏好「零配置」方案的用户

常规风险

  • API 密钥泄露GEMINI_API_KEY 需妥善保管,避免硬编码提交至版本控制
  • 内容安全:Gemini 内置安全过滤可能拒绝特定提示词,导致生成失败
  • 成本累积:高分辨率与多图任务消耗更多 Token,高频使用需监控用量
  • 输出一致性:同一提示词多次运行可能产生风格差异,不适用于严格品牌管控场景

安全解读

核心用法

nanobanana-pro-fallback 是一个轻量级 AI 图像生成工具,封装了 Google Gemini Image API,支持以下三种主要模式:

1. 文生图:通过文本描述直接生成图像

   uv run scripts/generate_image.py --prompt "描述" --filename "out.png" --resolution 1K

2. 图生图:基于单张输入图像进行编辑

   uv run scripts/generate_image.py --prompt "编辑指令" -i input.png --resolution 2K

3. 多图合成:支持最多 14 张图片融合创作

   uv run scripts/generate_image.py --prompt "合成场景" -i img1.png -i img2.png ...

输出分辨率可选 1K(默认)、2K4K

显著优点

  • 自动降级机制:模型调用链 gemini-2.5-flash-image → gemini-2.0-flash-exp,单模型失败时自动切换,提升可用性
  • 零依赖负担:使用 uv run 运行时即时拉取依赖,无需全局安装 Python 包
  • 多图支持:最多 14 张输入图,满足复杂合成场景
  • MEDIA 自动输出:脚本输出 MEDIA: 标记行,兼容 OpenClaw 自动附件机制

潜在缺点与局限

  • 平台绑定:必须使用 uv run 执行,直接 python3 调用会因缺少依赖而失败
  • 外部依赖:功能完全依赖 Google Gemini API 可用性和网络连接
  • T3 来源:个人开发者维护,长期更新承诺不明确
  • 无本地模型:不支持离线运行,所有计算在云端完成
  • 隐私考量:图像数据上传至 Google 服务器处理

适合人群

  • 需要快速、高质量 AI 图像生成的开发者与创意工作者
  • OpenClaw/CTOS 平台用户,追求与系统工作流无缝集成
  • 多图合成需求场景(电商设计、创意拼贴、场景重构)

常规风险

  • API 密钥泄露GEMINI_API_KEY 需妥善保管,避免提交至版本控制
  • 生成内容合规:AI 生成图像需遵守 Google 使用政策及当地法规
  • 成本累积:高频调用 Gemini API 可能产生可观费用
  • 输出不确定性:AI 生成结果存在随机性,需多次尝试或后期调整

Nanobanana Pro 内容

scripts文件夹
手动下载zip · 5.3 kB
generate_image.pytext/plain
请选择文件