nanobanana-pro-fallback

🍌 Gemini 高清生图与智能降级

基于 Gemini API 的高清图像生成工具,支持文生图/图生图及多模型自动降级,可输出 1K-4K 分辨率并合成多达 14 张图像。

收藏
1.6k
安装
599
版本
2.5
CLS 安全性认证2026-05-07
点击查看完整报告 >

使用说明

Nano Banana Pro Fallback 是一款基于 Google Gemini Image API 的图像生成与编辑工具,专为需要稳定、高质量 AI 绘图能力的用户设计。该技能通过 Python 脚本封装了 Gemini 的多模态能力,支持从文本生成图像、基于现有图像进行编辑,以及多图合成等高级功能。

核心用法

该技能通过命令行方式调用,必须使用 uv run 执行以确保依赖环境正确加载。基础用法包括文生图(text-to-image)和图生图(image-to-image)两种模式。用户可通过 --prompt 参数描述生成需求,使用 --filename 指定输出路径,并通过 --resolution 选择 1K、2K 或 4K 三种输出分辨率。对于图像编辑场景,支持通过 -i 参数传入最多 14 张参考图片进行多图合成或风格迁移。特别值得一提的是其智能降级机制:当首选模型 gemini-2.5-flash-image 不可用时,系统会自动回退至 gemini-2.0-flash-exp,确保服务连续性。

显著优点

首先,自动模型降级(Fallback)机制显著提升了可用性,避免因单一模型限流或下线导致任务中断。其次,采用 Google 官方 google-genai SDK,代码规范且安全可靠,无动态代码执行风险。功能层面支持高达 4K 的超高清分辨率输出,满足印刷级品质需求;多图合成能力(最多 14 张)为复杂场景构建和批量处理提供了可能。此外,使用 uv 作为运行时管理工具,免去了用户手动配置 Python 环境的麻烦。

潜在局限

作为 T3 来源的个人开源项目,缺乏大型组织背书,长期维护存在不确定性。功能上严格依赖 Google Gemini API 的可用性和网络连接,无法离线使用。依赖版本采用宽松约束(>= 而非 ==),可能在依赖库重大更新时引入兼容性问题。另外,虽然支持多图输入,但所有图像数据均需上传至 Google 服务器处理,对敏感内容存在隐私顾虑。

适用人群

适合开发者、设计师、内容创作者及需要批量生成营销素材的运营人员。特别是那些需要稳定 API 服务(通过自动降级保障)、追求高分辨率输出(2K/4K)或经常进行图像合成(多图参考)的专业用户。对于已通过 OpenClaw 或 CTOS 平台配置好 Gemini API Key 的技术用户尤为便捷。

使用风险

主要风险包括 API 调用成本(Gemini API 按量计费)、数据隐私(原图上传至 Google 云端处理)、网络依赖性(需稳定连接 Google 服务)以及工具链依赖(必须安装 uv 运行时)。建议用户妥善保管 GEMINI_API_KEY,避免在共享环境中硬编码密钥;处理敏感图像前需评估隐私合规要求;同时关注 uv 和 Python 依赖的兼容性状态。

安全解读

核心功能

Nano Banana Pro with Fallback 是一款集成 Google Gemini Image API 的图像生成与编辑工具,支持两种主要工作模式:

  • 文生图(Text-to-Image):通过自然语言描述生成全新图像
  • 图生图(Image-to-Image):基于输入图像进行编辑、风格转换或场景重组,最多支持 14 张图片同时处理

输出分辨率可选 1K/2K/4K,默认输出为 PNG 格式。

显著优点

1. 智能降级机制:当首选模型 gemini-2.5-flash-image 不可用时,自动回退至 gemini-2.0-flash-exp-image-generation,通过环境变量 NANOBANANA_FALLBACK_MODELS 可自定义降级链
2. 多图合成能力:业界少有的支持 14 张图片同时输入的 AI 图像工具,适合复杂场景创作

3. 零配置运行:基于 uv 的 Python 依赖管理,无需手动安装依赖,单命令即可执行

4. OpenClaw 原生集成:输出自动附加 MEDIA: 标签,支持主流聊天平台的图片自动渲染

5. 安全合规:通过 CLS-Certify 全量扫描(T-HEAVY 模式),静态/动态分析均通过,GDPR/CCPA 合规

潜在局限

  • T3 来源风险:维护者 yazelin 为个人开发者,虽代码审查无虞,但长期维护能力存疑
  • Google API 依赖:仅限 Gemini 生态,不支持 Midjourney、DALL-E 等替代方案
  • 无交互界面:纯 CLI 工具,无图形界面或 Web 控制台
  • 成本不可控:Gemini API 按 token 计费,高频使用需关注账单

适合人群

  • OpenClaw/Ching-Tech OS 用户寻求原生 AI 图像能力
  • 需要批量图像处理的技术工作者
  • 对多图融合有强需求的创意设计师
  • 偏好命令行效率而非 GUI 的开发者

常规风险

| 风险类型 | 等级 | 说明 |
|---------|------|------|
| API 密钥泄露 | 中 | 需通过环境变量 `GEMINI_API_KEY` 配置,避免硬编码 |
| 生成内容合规 | 中 | Gemini API 受 Google 内容政策约束,可能拒绝特定提示词 |
| 模型可用性 | 低 | 自动降级机制有效缓解单点故障 |
| 依赖供应链 | 低 | 仅依赖 `google-genai` 和 `pillow` 两个知名包 |

nanobanana-pro-fallback 内容

scripts文件夹
手动下载zip · 5.4 kB
generate_image.pytext/plain
请选择文件