Nanobanana Pro

🍌 AI图像生成 · 智能模型降级

基于Gemini Image API的智能图像生成与编辑工具,支持多模型自动降级和多图合成,需配置API密钥使用。

收藏
8.5k
安装
2.6k
版本
0.4.1
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

Nano Banana Pro Fallback 是一个封装了 Gemini Image API 的图像生成与编辑工具,主要功能包括:

图像生成:通过自然语言描述生成高质量图像,支持 1K/2K/4K 三种分辨率
图像编辑:基于现有图片进行智能编辑,支持单图修改和多图合成(最多14张)

自动降级:当首选模型(gemini-2.5-flash-image)失败时,自动回退到备用模型

使用方式

必须使用 uv run 或提供的 generate 包装脚本执行,不可直接用 python3。命令行参数支持 --prompt 描述、--filename 输出路径、--resolution 分辨率以及 -i 输入图片路径。

配置要求

  • 必须设置 GEMINI_API_KEY 环境变量
  • 依赖 uv 包管理器(通过 Homebrew 安装)
  • 支持 OpenClaw 和 Ching-Tech-OS 平台

显著优点

1. 多模型容错:内置自动降级机制,提升任务成功率
2. 多图合成能力:支持最多14张图片的智能融合,适合复杂场景创作

3. 原生OpenClaw集成:输出包含 MEDIA: 标记,支持自动附件识别

4. 分辨率灵活:提供从 1K 到 4K 的多种输出规格

5. 零依赖直接运行:通过 uv run 动态管理依赖,无需手动安装 Python 包

潜在缺点与局限性

  • 商业API成本:依赖 Google Gemini 付费 API,高频使用产生费用
  • 平台限制:仅支持 OpenClaw 和 Ching-Tech-OS,通用性受限
  • 外部依赖:必须安装 uv 工具链,增加环境准备复杂度
  • 无本地模型:纯云端方案,无法离线使用,存在网络延迟
  • 密钥管理风险:API密钥需用户自行配置,存在泄露风险

适合人群

  • OpenClaw/Ching-Tech-OS 生态用户
  • 需要批量图像生成或编辑的创作者、设计师
  • 追求"生成-自动附加"无缝工作流的效率用户
  • 能接受按量付费模式的轻量级使用者

常规风险

1. API密钥安全GEMINI_API_KEY 需妥善保管,避免硬编码或误提交
2. 内容合规:Gemini API 对生成内容有政策限制,可能触发过滤

3. 费用失控:高分辨率(4K)和多图合成消耗更多 token,建议设置预算告警

4. 模型可用性:实验性模型(如 gemini-2.0-flash-exp)可能随时调整或下线

5. 输出不可复现:AI生成图像存在随机性,相同提示词可能产生不同结果

Nanobanana Pro 内容

暂无文件树

手动下载zip · 4.1 kB
contentapplication/octet-stream
请选择文件