Nanobanana Pro

🍌 AI图像生成·自动降级·多图合成

media-generation榜 #18

基于 Gemini Image API 的图像生成与编辑工具,支持自动模型降级和多图合成,一键生成 1K/2K/4K 分辨率图片

收藏
12.9k
安装
2.6k
版本
0.4.2
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心功能

Nano Banana Pro 是一款面向 OpenClaw 和 Ching Tech OS 平台的 AI 图像生成技能,封装了 Gemini Image API 的调用能力,提供文本生图与图像编辑双模式。

核心用法

  • 文生图:通过 --prompt 描述生成图片,支持 1K/2K/4K 三种分辨率
  • 图生图:使用 -i 参数传入单张或多张(最多 14 张)参考图进行编辑或融合
  • 自动降级:当首选模型 gemini-2.5-flash-image 失败时,自动回退至 gemini-2.0-flash-exp-image-generation
  • 依赖管理:强制使用 uv run 执行,确保 Python 依赖环境隔离

显著优点

1. 模型鲁棒性:内置多模型 fallback 机制,降低单点故障风险
2. 多图合成:支持最多 14 张图片输入,适合复杂场景构建

3. 分辨率灵活:从快速预览(1K)到高质输出(4K)三档可选

4. 平台集成:针对 OpenClaw 优化,输出带 MEDIA: 标记便于自动附件识别

局限与风险

  • 环境依赖:必须预装 uv 并配置 GEMINI_API_KEY,无密钥则完全不可用
  • 执行约束:严禁直接使用 python3,否则依赖缺失导致失败
  • 平台限制:官方仅认证 openclawching-tech-os 两个平台
  • 无安全审计:技能简介明确标注"未执行安全扫描",代码可信度依赖作者声誉

适合人群

  • OpenClaw 生态用户,需要快速集成 Gemini 图像能力的开发者
  • 对模型稳定性有要求、不愿手动处理 API 错误的自动化场景
  • 需要批量多图合成的工作流(电商、设计预览等)

风险提示

  • 外部 API 调用存在数据隐私风险,敏感图片请勿上传
  • 自动降级逻辑透明但不可自定义重试次数或超时策略
  • 项目处于早期版本(0.4.0),API 变更可能导致破坏性更新

Nanobanana Pro 内容

暂无文件树

手动下载zip · 4.2 kB
contentapplication/octet-stream
请选择文件