Nanobanana Pro

🍌 Gemini 多模态图像生成与自动修复

ai榜 #8

基于 Gemini 图像模型的 AI 图片生成与编辑工具,支持多模型自动降级与多图融合,适合开发者集成工作流。

收藏
12.4k
安装
2.6k
版本
0.2.0
CLS 安全性认证2026-06-03
点击查看完整报告 >

使用说明

核心用法

Nano Banana Pro 是一款面向命令行用户的 AI 图像生成与编辑工具,封装了 Google Gemini 的图像模型能力,提供三大核心功能:

  • 生成(Generate):通过文本提示直接生成图片,支持 1K/2K/4K 分辨率输出
  • 编辑(Edit):支持单图或多图(最多14张)融合编辑,基于提示词进行图像修改
  • 修复(Restore):对低质量或损坏图像进行增强、超分辨率等修复操作

工具采用 uv 运行环境,无需复杂依赖安装。执行时自动尝试多个 Gemini 模型(默认顺序:gemini-2.5-flash-image → gemini-2.0-flash-exp-image-generation),当主模型失败时无缝降级,提升任务成功率。

输出文件支持时间戳命名规范,脚本自动打印 MEDIA: 标记便于 OpenClaw 等框架识别和附加媒体文件。

显著优点

1. 模型容错机制:内置多模型自动回退,避免单点失败导致任务中断
2. 多图处理能力:支持最多14张图片同时输入,适合复杂合成场景

3. 分辨率可选:提供 1K/2K/4K 三档输出,兼顾速度与画质

4. CLI 友好:纯命令行操作,易于集成到自动化脚本和 CI/CD 流程

5. 轻量部署:依赖 uv 快速运行,无需繁琐的 Python 环境配置

潜在局限

  • 依赖 Google Gemini API,受限于服务可用性与地域政策
  • 仅支持 Gemini 系列模型,无法切换至其他厂商(如 DALL-E、Midjourney、SD)
  • 命令行界面无图形预览,需手动查看输出文件
  • 图像编辑效果高度依赖提示词质量,复杂语义理解可能存在偏差
  • 免费/付费额度受 Gemini API 计费策略约束,高频使用需关注成本

适合人群

  • 开发者需要将 AI 图像生成集成到自动化工作流
  • 技术用户偏好命令行工具,追求效率与可脚本化
  • 多图融合、批量处理需求的创意工作者
  • OpenClaw / Ching-Tech OS 平台生态用户

常规风险

  • API 密钥泄露GEMINI_API_KEY 需妥善保管,避免硬编码提交至代码仓库
  • 内容合规:Gemini 模型内置安全过滤器,敏感内容可能被拒绝生成
  • 输出不可控:AI 生成图像存在随机性,同一提示词多次执行结果可能差异较大
  • 版权模糊:生成图像的版权归属需遵循 Google 服务条款及当地法规
  • 依赖服务稳定性:模型降级虽提升容错,但底层服务整体不可用时仍将失败

安全解读

功能概述

Nano Banana Pro 是一款集成 Google Gemini 多模态大模型的 AI 图像生成 Skill,支持三大核心功能:

  • Generate(生成):根据文本描述创建新图像,支持 1K/2K/4K 分辨率
  • Edit(编辑):支持单图或多图(最多14张)智能编辑与融合
  • Restore(修复):图像增强与超分辨率重建

技术实现亮点

该 Skill 采用零外部依赖架构,完全基于 Python 标准库实现,彻底消除了供应链攻击风险。网络层仅通过 HTTPS 访问 Google 官方 Gemini API(generativelanguage.googleapis.com),传输加密合规。API Key 通过环境变量注入,无硬编码敏感信息。

智能降级机制是其差异化特性:当首选模型 gemini-2.5-flash-image 不可用时,自动回退至 gemini-2.0-flash-exp-image-generation,并支持通过 NANOBANANA_FALLBACK_MODELS 自定义降级链,保障服务连续性。

显著优点

1. 极致轻量化:6 个文件、351 行代码,标准库-only,部署零摩擦
2. 安全合规:通过 CLS-Certify S 级认证(90分),GDPR/CCPA 全项通过

3. 模型弹性:自动故障转移,避免单点失效

4. 生态兼容:原生适配 OpenClaw 与 CTOS 双平台,自动识别 MEDIA: 输出标记

潜在局限

  • 来源层级:T3 个人开发者维护,无企业 SLA 背书
  • 数据出境:图像与提示词需发送至 Google 美国服务器处理
  • 功能边界:无本地模型推理能力,完全依赖云端 API
  • 配额依赖:受 Gemini API 速率限制与计费策略约束

适合人群

  • 追求极简部署的个人创作者与开发者
  • 已通过 Gemini API 合规审批的企业内测场景
  • 需要快速原型验证的 AI 应用构建者
  • 对供应链安全高度敏感的生产环境

常规风险

  • API 服务中断或策略变更可能影响可用性
  • 生成内容受 Google 安全过滤器限制,存在误判可能
  • 高频调用可能产生不可预期的云成本

Nanobanana Pro 内容

scripts文件夹
手动下载zip · 5.6 kB
_common.pytext/plain
请选择文件