使用说明

核心用法

Nano Banana 是一款基于 CLI 的 Gemini 原生图像生成工具，通过 inference.sh 平台调用 Google 最新的图像生成模型。用户只需安装轻量级 CLI 工具并登录，即可通过简单的命令行指令完成高质量图像生成。

主要功能

文本生成图像：支持从自然语言描述生成图像
图像编辑：可基于现有图像进行修改（最多支持 14 张输入图）
多图生成：单次请求生成多张变体图像
高级参数控制：支持自定义宽高比（1:1、16:9、9:16 等）、分辨率（最高 4K）、输出格式
Google Search 增强：启用实时信息 grounding，生成时效性内容

模型选择

| 模型 | 定位 | 速度 | 质量 |

|------|------|------|------|

| Gemini 3 Pro Image | 专业级预览版 | 较慢 | 最佳 |

| Gemini 2.5 Flash Image | 平衡版 | 快速 | 优秀 |

典型工作流

1. 安装 CLI：curl -fsSL https://cli.inference.sh | sh && infsh login
2. 生成或编辑图像：infsh app run google/gemini-3-pro-image-preview --input '{"prompt": "..."}'
3. 探索更多：通过 infsh app sample 查看完整参数选项

显著优点

原生 Gemini 能力：直接调用 Google 官方图像模型，非第三方封装
轻量安全：安装脚本仅检测系统架构、下载二进制文件并校验 SHA-256，无需管理员权限或后台进程
灵活输入：支持 URL 引用、本地文件、多图组合等复杂场景
实时搜索增强：独特的 enable_google_search 功能可将实时信息融入图像生成
生态系统完善：与 inference.sh 平台 150+ 应用无缝集成，可扩展至视频生成等工作流

潜在局限

CLI 门槛：需要命令行基础，无图形界面
平台依赖：完全依赖 inference.sh 服务可用性
模型限制：Gemini 3 Pro 的 4K 分辨率等功能仅限该模型
预览状态：Gemini 3 Pro Image 标注为 preview，可能存在稳定性变动
网络要求：需稳定连接至 inference.sh 和 Google 服务

适合人群

开发者、设计师、内容创作者等熟悉命令行操作的技术用户
需要批量生成、自动化图像工作流的专业人士
追求 Google 原生图像质量、希望避免复杂 API 配置的用户
需要将图像生成集成到更大 AI 工作流（如视频生成）的高级用户

常规风险

第三方平台风险：inference.sh 作为中间平台，存在服务中断或政策变更可能
数据隐私：图像 prompt 和生成内容需经过 inference.sh 服务端
成本管理：高频调用可能产生费用，需注意配额控制
输出一致性：AI 图像生成存在随机性，多次运行结果可能差异较大
版权合规：生成内容的商用权利需遵循 Google Gemini 服务条款

gemini google-ai image-generation text-to-image cli-tool inference-sh image-editing multi-image native-model

Nano Banana 2 内容

手动下载zip · 2.1 kB

SKILL.mdtext/markdown

请选择文件