使用说明

核心用法

Nano Banana Pro Fallback 是一个封装了 Gemini Image API 的图像生成与编辑工具，主要功能包括：

图像生成：通过自然语言描述生成高质量图像，支持 1K/2K/4K 三种分辨率
图像编辑：基于现有图片进行智能编辑，支持单图修改和多图合成（最多14张）
自动降级：当首选模型（gemini-2.5-flash-image）失败时，自动回退到备用模型

使用方式

必须使用 uv run 或提供的 generate 包装脚本执行，不可直接用 python3。命令行参数支持 --prompt 描述、--filename 输出路径、--resolution 分辨率以及 -i 输入图片路径。

配置要求

必须设置 GEMINI_API_KEY 环境变量
依赖 uv 包管理器（通过 Homebrew 安装）
支持 OpenClaw 和 Ching-Tech-OS 平台

显著优点

1. 多模型容错：内置自动降级机制，提升任务成功率
2. 多图合成能力：支持最多14张图片的智能融合，适合复杂场景创作
3. 原生OpenClaw集成：输出包含 MEDIA: 标记，支持自动附件识别
4. 分辨率灵活：提供从 1K 到 4K 的多种输出规格
5. 零依赖直接运行：通过 uv run 动态管理依赖，无需手动安装 Python 包

潜在缺点与局限性

商业API成本：依赖 Google Gemini 付费 API，高频使用产生费用
平台限制：仅支持 OpenClaw 和 Ching-Tech-OS，通用性受限
外部依赖：必须安装 uv 工具链，增加环境准备复杂度
无本地模型：纯云端方案，无法离线使用，存在网络延迟
密钥管理风险：API密钥需用户自行配置，存在泄露风险

适合人群

OpenClaw/Ching-Tech-OS 生态用户
需要批量图像生成或编辑的创作者、设计师
追求"生成-自动附加"无缝工作流的效率用户
能接受按量付费模式的轻量级使用者

常规风险

1. API密钥安全：GEMINI_API_KEY 需妥善保管，避免硬编码或误提交
2. 内容合规：Gemini API 对生成内容有政策限制，可能触发过滤
3. 费用失控：高分辨率（4K）和多图合成消耗更多 token，建议设置预算告警
4. 模型可用性：实验性模型（如 gemini-2.0-flash-exp）可能随时调整或下线
5. 输出不可复现：AI生成图像存在随机性，相同提示词可能产生不同结果

image-generation gemini-api ai-art automation uv python cli-tool multi-model fallback

Nanobanana Pro 内容

scripts文件夹

手动下载zip · 4.1 kB

generate_image.pytext/plain

请选择文件