skills/steipete/nano-banana-pro

nano-banana-pro

🍌 Gemini 3 Pro 图像生成引擎

编辑精选

基于 Google Gemini 3 Pro Image 官方 API 的图像生成与编辑工具，支持多图合成与多分辨率输出，为创作者提供企业级 AI 图像能力。

收藏

5.8k

安装

1.2k

版本

v1.0.1

CLS 安全性认证2026-05-04

点击查看完整报告 >

使用说明

核心用法

Nano Banana Pro 是一款基于 Google Gemini 3 Pro Image API 的图像生成与编辑 Skill，通过命令行脚本实现三种核心功能：

1. 文本生成图像：使用 uv run 执行 generate_image.py，通过 --prompt 参数描述所需图像内容，，--resolution 指定 1K/2K/4K 输出分辨率，结果自动保存为 PNG 格式。

2. 单图编辑：添加 -i 参数传入现有图像路径，结合编辑指令 prompt 实现局部修改、风格迁移或内容增强。

3. 多图合成：支持最多 14 张输入图像的复杂场景组合，适用于创意拼贴、场景融合等高级创作需求。

API 认证通过 GEMINI_API_KEY 环境变量或配置文件管理，脚本输出包含 MEDIA:: 标记便于 Moltbot 自动附件识别。

显著优点

官方 SDK 保障：采用 Google 官方 google-genai 库，协议合规、更新及时，避免第三方封装的不确定性。
分辨率灵活：1K/2K/4K 三档输出适配不同场景，从社交媒体预览到印刷级素材均可覆盖。
多图处理能力：14 张图像上限超越多数同类工具，适合复杂视觉叙事和批量素材整合。
生态集成：与 uv 现代 Python 包管理器深度整合，依赖解析和隔离自动化，降低环境配置成本。
输出规范：强制时间戳命名约定减少版本混乱，MEDIA 标记实现与聊天机器人的无缝衔接。

潜在缺点与局限性

外部 API 依赖：功能完全绑定 Google 服务，网络中断或 API 变更将直接导致服务不可用。
密钥管理负担：用户需自行申请并保管 Gemini API 密钥，存在泄露风险和配额管理复杂度。
无本地模型选项：所有计算在云端完成，无法离线使用，敏感图像内容需上传至 Google 服务器。
输出格式单一：仅支持 PNG 输出，缺乏 JPEG 质量调节、WebP 优化或透明通道精细控制选项。
编辑可控性有限：基于 prompt 的编辑依赖模型理解能力，精细像素级调整或遮罩编辑无法实现。

适合的目标群体

内容创作者：博主、设计师、营销人员需要快速生成配图或视觉素材。
开发者与产品经理：原型设计阶段需要低成本、高效率的视觉概念验证。
AI 工作流集成者：已将 Moltbot 或类似 Agent 平台纳入日常工具链的技术用户。
教育与研究：需要批量生成示例图像用于教学材料或数据集构建的学术场景。

使用风险

性能波动：图像生成耗时受网络延迟和 Google API 负载影响，4K 分辨率可能出现超时或重试。
成本累积：Gemini API 按调用计费，高频使用或高分辨率输出可能产生意外费用。
内容合规：生成内容受 Google 使用政策约束，特定主题可能触发审核或拒绝。
文件覆盖：未检查目标路径是否存在，重复运行可能意外覆盖历史输出。
依赖版本锁定：google-genai>=1.0.0 的宽松约束可能在未来引入破坏性变更。

安全解读

核心用法

Nano Banana Pro 是一款基于 Google Gemini 3 Pro Image API 的图像生成与编辑工具，通过命令行脚本实现以下功能：

图像生成：使用 uv run generate_image.py --prompt "描述" 生成新图像，支持 1K/2K/4K 三种分辨率。

图像编辑：通过 -i 参数传入单张图片，结合提示词进行智能编辑修改。

多图融合：支持最多 14 张输入图像的合成创作，适用于场景组合、风格迁移等复杂任务。

集成特性：脚本输出包含 MEDIA: 标记行，可被 Moltbot 自动识别并在支持的平台直接展示图片。

显著优点

官方 API 背书：底层调用 Google Gemini 3 Pro，图像质量和理解能力处于行业第一梯队
安全架构完善：API Key 仅通过环境变量读取，零硬编码风险；代码通过 S+ 级安全认证
依赖极简可信：仅使用 google-genai 和 pillow 两个官方维护库，无供应链攻击面
灵活分辨率：从快速预览（1K）到高质量输出（4K）三档可选
多图上限充裕：14 张图的合成上限满足绝大多数创意场景

潜在缺点与局限性

网络依赖强：必须连接 Google 云服务，无法离线使用，部分地区可能受限
成本累积：Gemini 3 Pro 为付费 API，高频调用产生持续费用
文件覆盖风险：当前版本直接覆盖同名输出文件，无二次确认
错误信息简略：API 调用失败时日志不够详细，排查需经验
平台绑定：MEDIA 自动附件功能依赖特定聊天平台支持

适合人群

需要快速生成概念图、插画、产品图的设计师和创作者
希望批量处理图像编辑的技术用户
已将 Google AI 生态整合进工作流的团队
对代码安全有较高要求、不愿使用闭源工具的企业环境

常规风险

| 风险类型 | 等级 | 说明 |

|---------|------|------|

| API Key 泄露 | 中 | 环境变量配置不当可能导致密钥暴露，建议配合密钥管理工具 |

| 内容合规 | 中 | Gemini API 内置内容过滤，极端提示词可能被拒绝 |

| 数据隐私 | 低 | 图片上传至 Google 处理，敏感图像需谨慎评估 |

| 服务可用性 | 低 | 依赖 Google Cloud SLA，历史稳定性良好 |

image-gen content-media api productivity design

nano-banana-pro 内容

scripts文件夹

手动下载zip · 3.3 kB

generate_image.pytext/plain

请选择文件