使用说明

Nano Banana Pro Fallback 是一款基于 Google Gemini Image API 的图像生成与编辑工具，专为需要稳定、高质量 AI 绘图能力的用户设计。该技能通过 Python 脚本封装了 Gemini 的多模态能力，支持从文本生成图像、基于现有图像进行编辑，以及多图合成等高级功能。

核心用法

该技能通过命令行方式调用，必须使用 uv run 执行以确保依赖环境正确加载。基础用法包括文生图（text-to-image）和图生图（image-to-image）两种模式。用户可通过 --prompt 参数描述生成需求，使用 --filename 指定输出路径，并通过 --resolution 选择 1K、2K 或 4K 三种输出分辨率。对于图像编辑场景，支持通过 -i 参数传入最多 14 张参考图片进行多图合成或风格迁移。特别值得一提的是其智能降级机制：当首选模型 gemini-2.5-flash-image 不可用时，系统会自动回退至 gemini-2.0-flash-exp，确保服务连续性。

显著优点

首先，自动模型降级（Fallback）机制显著提升了可用性，避免因单一模型限流或下线导致任务中断。其次，采用 Google 官方 google-genai SDK，代码规范且安全可靠，无动态代码执行风险。功能层面支持高达 4K 的超高清分辨率输出，满足印刷级品质需求；多图合成能力（最多 14 张）为复杂场景构建和批量处理提供了可能。此外，使用 uv 作为运行时管理工具，免去了用户手动配置 Python 环境的麻烦。

潜在局限

作为 T3 来源的个人开源项目，缺乏大型组织背书，长期维护存在不确定性。功能上严格依赖 Google Gemini API 的可用性和网络连接，无法离线使用。依赖版本采用宽松约束（>= 而非 ==），可能在依赖库重大更新时引入兼容性问题。另外，虽然支持多图输入，但所有图像数据均需上传至 Google 服务器处理，对敏感内容存在隐私顾虑。

适用人群

适合开发者、设计师、内容创作者及需要批量生成营销素材的运营人员。特别是那些需要稳定 API 服务（通过自动降级保障）、追求高分辨率输出（2K/4K）或经常进行图像合成（多图参考）的专业用户。对于已通过 OpenClaw 或 CTOS 平台配置好 Gemini API Key 的技术用户尤为便捷。

使用风险

主要风险包括 API 调用成本（Gemini API 按量计费）、数据隐私（原图上传至 Google 云端处理）、网络依赖性（需稳定连接 Google 服务）以及工具链依赖（必须安装 uv 运行时）。建议用户妥善保管 GEMINI_API_KEY，避免在共享环境中硬编码密钥；处理敏感图像前需评估隐私合规要求；同时关注 uv 和 Python 依赖的兼容性状态。

安全解读

核心功能

Nano Banana Pro with Fallback 是一款集成 Google Gemini Image API 的图像生成与编辑工具，支持两种主要工作模式：

文生图（Text-to-Image）：通过自然语言描述生成全新图像
图生图（Image-to-Image）：基于输入图像进行编辑、风格转换或场景重组，最多支持 14 张图片同时处理

输出分辨率可选 1K/2K/4K，默认输出为 PNG 格式。

显著优点

1. 智能降级机制：当首选模型 gemini-2.5-flash-image 不可用时，自动回退至 gemini-2.0-flash-exp-image-generation，通过环境变量 NANOBANANA_FALLBACK_MODELS 可自定义降级链
2. 多图合成能力：业界少有的支持 14 张图片同时输入的 AI 图像工具，适合复杂场景创作
3. 零配置运行：基于 uv 的 Python 依赖管理，无需手动安装依赖，单命令即可执行
4. OpenClaw 原生集成：输出自动附加 MEDIA: 标签，支持主流聊天平台的图片自动渲染
5. 安全合规：通过 CLS-Certify 全量扫描（T-HEAVY 模式），静态/动态分析均通过，GDPR/CCPA 合规

潜在局限

T3 来源风险：维护者 yazelin 为个人开发者，虽代码审查无虞，但长期维护能力存疑
Google API 依赖：仅限 Gemini 生态，不支持 Midjourney、DALL-E 等替代方案
无交互界面：纯 CLI 工具，无图形界面或 Web 控制台
成本不可控：Gemini API 按 token 计费，高频使用需关注账单

适合人群

OpenClaw/Ching-Tech OS 用户寻求原生 AI 图像能力
需要批量图像处理的技术工作者
对多图融合有强需求的创意设计师
偏好命令行效率而非 GUI 的开发者

常规风险

| 风险类型 | 等级 | 说明 |

|---------|------|------|

| API 密钥泄露 | 中 | 需通过环境变量 `GEMINI_API_KEY` 配置，避免硬编码 |

| 生成内容合规 | 中 | Gemini API 受 Google 内容政策约束，可能拒绝特定提示词 |

| 模型可用性 | 低 | 自动降级机制有效缓解单点故障 |

| 依赖供应链 | 低 | 仅依赖 `google-genai` 和 `pillow` 两个知名包 |

image-gen api content-media productivity design

nanobanana-pro-fallback 内容

scripts文件夹

手动下载zip · 5.4 kB

generate_image.pytext/plain

请选择文件