nano-banana-pro

🍌 Gemini 3 Pro 图像生成引擎

编辑精选

基于 Google Gemini 3 Pro Image 官方 API 的图像生成与编辑工具,支持多图合成与多分辨率输出,为创作者提供企业级 AI 图像能力。

收藏
5.8k
安装
1.2k
版本
v1.0.1
CLS 安全性认证2026-05-04
点击查看完整报告 >

使用说明

核心用法

Nano Banana Pro 是一款基于 Google Gemini 3 Pro Image API 的图像生成与编辑 Skill,通过命令行脚本实现三种核心功能:

1. 文本生成图像:使用 uv run 执行 generate_image.py,通过 --prompt 参数描述所需图像内容,,--resolution 指定 1K/2K/4K 输出分辨率,结果自动保存为 PNG 格式。

2. 单图编辑:添加 -i 参数传入现有图像路径,结合编辑指令 prompt 实现局部修改、风格迁移或内容增强。

3. 多图合成:支持最多 14 张输入图像的复杂场景组合,适用于创意拼贴、场景融合等高级创作需求。

API 认证通过 GEMINI_API_KEY 环境变量或配置文件管理,脚本输出包含 MEDIA:: 标记便于 Moltbot 自动附件识别。

显著优点

  • 官方 SDK 保障:采用 Google 官方 google-genai 库,协议合规、更新及时,避免第三方封装的不确定性。
  • 分辨率灵活:1K/2K/4K 三档输出适配不同场景,从社交媒体预览到印刷级素材均可覆盖。
  • 多图处理能力:14 张图像上限超越多数同类工具,适合复杂视觉叙事和批量素材整合。
  • 生态集成:与 uv 现代 Python 包管理器深度整合,依赖解析和隔离自动化,降低环境配置成本。
  • 输出规范:强制时间戳命名约定减少版本混乱,MEDIA 标记实现与聊天机器人的无缝衔接。

潜在缺点与局限性

  • 外部 API 依赖:功能完全绑定 Google 服务,网络中断或 API 变更将直接导致服务不可用。
  • 密钥管理负担:用户需自行申请并保管 Gemini API 密钥,存在泄露风险和配额管理复杂度。
  • 无本地模型选项:所有计算在云端完成,无法离线使用,敏感图像内容需上传至 Google 服务器。
  • 输出格式单一:仅支持 PNG 输出,缺乏 JPEG 质量调节、WebP 优化或透明通道精细控制选项。
  • 编辑可控性有限:基于 prompt 的编辑依赖模型理解能力,精细像素级调整或遮罩编辑无法实现。

适合的目标群体

  • 内容创作者:博主、设计师、营销人员需要快速生成配图或视觉素材。
  • 开发者与产品经理:原型设计阶段需要低成本、高效率的视觉概念验证。
  • AI 工作流集成者:已将 Moltbot 或类似 Agent 平台纳入日常工具链的技术用户。
  • 教育与研究:需要批量生成示例图像用于教学材料或数据集构建的学术场景。

使用风险

  • 性能波动:图像生成耗时受网络延迟和 Google API 负载影响,4K 分辨率可能出现超时或重试。
  • 成本累积:Gemini API 按调用计费,高频使用或高分辨率输出可能产生意外费用。
  • 内容合规:生成内容受 Google 使用政策约束,特定主题可能触发审核或拒绝。
  • 文件覆盖:未检查目标路径是否存在,重复运行可能意外覆盖历史输出。
  • 依赖版本锁定google-genai>=1.0.0 的宽松约束可能在未来引入破坏性变更。

安全解读

核心用法

Nano Banana Pro 是一款基于 Google Gemini 3 Pro Image API 的图像生成与编辑工具,通过命令行脚本实现以下功能:

图像生成:使用 uv run generate_image.py --prompt "描述" 生成新图像,支持 1K/2K/4K 三种分辨率。

图像编辑:通过 -i 参数传入单张图片,结合提示词进行智能编辑修改。

多图融合:支持最多 14 张输入图像的合成创作,适用于场景组合、风格迁移等复杂任务。

集成特性:脚本输出包含 MEDIA: 标记行,可被 Moltbot 自动识别并在支持的平台直接展示图片。

显著优点

  • 官方 API 背书:底层调用 Google Gemini 3 Pro,图像质量和理解能力处于行业第一梯队
  • 安全架构完善:API Key 仅通过环境变量读取,零硬编码风险;代码通过 S+ 级安全认证
  • 依赖极简可信:仅使用 google-genaipillow 两个官方维护库,无供应链攻击面
  • 灵活分辨率:从快速预览(1K)到高质量输出(4K)三档可选
  • 多图上限充裕:14 张图的合成上限满足绝大多数创意场景

潜在缺点与局限性

  • 网络依赖强:必须连接 Google 云服务,无法离线使用,部分地区可能受限
  • 成本累积:Gemini 3 Pro 为付费 API,高频调用产生持续费用
  • 文件覆盖风险:当前版本直接覆盖同名输出文件,无二次确认
  • 错误信息简略:API 调用失败时日志不够详细,排查需经验
  • 平台绑定:MEDIA 自动附件功能依赖特定聊天平台支持

适合人群

  • 需要快速生成概念图、插画、产品图的设计师和创作者
  • 希望批量处理图像编辑的技术用户
  • 已将 Google AI 生态整合进工作流的团队
  • 对代码安全有较高要求、不愿使用闭源工具的企业环境

常规风险

| 风险类型 | 等级 | 说明 |
|---------|------|------|
| API Key 泄露 | 中 | 环境变量配置不当可能导致密钥暴露,建议配合密钥管理工具 |
| 内容合规 | 中 | Gemini API 内置内容过滤,极端提示词可能被拒绝 |
| 数据隐私 | 低 | 图片上传至 Google 处理,敏感图像需谨慎评估 |
| 服务可用性 | 低 | 依赖 Google Cloud SLA,历史稳定性良好 |

nano-banana-pro 内容

scripts文件夹
手动下载zip · 3.3 kB
generate_image.pytext/plain
请选择文件