核心用法
Nano Banana 是一款基于 CLI 的 Gemini 原生图像生成工具,通过 inference.sh 平台调用 Google 最新的图像生成模型。用户只需安装轻量级 CLI 工具并登录,即可通过简单的命令行指令完成高质量图像生成。
主要功能
- 文本生成图像:支持从自然语言描述生成图像
- 图像编辑:可基于现有图像进行修改(最多支持 14 张输入图)
- 多图生成:单次请求生成多张变体图像
- 高级参数控制:支持自定义宽高比(1:1、16:9、9:16 等)、分辨率(最高 4K)、输出格式
- Google Search 增强:启用实时信息 grounding,生成时效性内容
模型选择
| 模型 | 定位 | 速度 | 质量 |
|------|------|------|------|
| Gemini 3 Pro Image | 专业级预览版 | 较慢 | 最佳 |
| Gemini 2.5 Flash Image | 平衡版 | 快速 | 优秀 |
典型工作流
1. 安装 CLI:curl -fsSL https://cli.inference.sh | sh && infsh login
2. 生成或编辑图像:infsh app run google/gemini-3-pro-image-preview --input '{"prompt": "..."}'
3. 探索更多:通过 infsh app sample 查看完整参数选项
显著优点
- 原生 Gemini 能力:直接调用 Google 官方图像模型,非第三方封装
- 轻量安全:安装脚本仅检测系统架构、下载二进制文件并校验 SHA-256,无需管理员权限或后台进程
- 灵活输入:支持 URL 引用、本地文件、多图组合等复杂场景
- 实时搜索增强:独特的
enable_google_search功能可将实时信息融入图像生成 - 生态系统完善:与 inference.sh 平台 150+ 应用无缝集成,可扩展至视频生成等工作流
潜在局限
- CLI 门槛:需要命令行基础,无图形界面
- 平台依赖:完全依赖 inference.sh 服务可用性
- 模型限制:Gemini 3 Pro 的 4K 分辨率等功能仅限该模型
- 预览状态:Gemini 3 Pro Image 标注为 preview,可能存在稳定性变动
- 网络要求:需稳定连接至 inference.sh 和 Google 服务
适合人群
- 开发者、设计师、内容创作者等熟悉命令行操作的技术用户
- 需要批量生成、自动化图像工作流的专业人士
- 追求 Google 原生图像质量、希望避免复杂 API 配置的用户
- 需要将图像生成集成到更大 AI 工作流(如视频生成)的高级用户
常规风险
- 第三方平台风险:inference.sh 作为中间平台,存在服务中断或政策变更可能
- 数据隐私:图像 prompt 和生成内容需经过 inference.sh 服务端
- 成本管理:高频调用可能产生费用,需注意配额控制
- 输出一致性:AI 图像生成存在随机性,多次运行结果可能差异较大
- 版权合规:生成内容的商用权利需遵循 Google Gemini 服务条款