核心功能
Nano Banana 2 是一个封装了 Google Gemini 3.1 Flash Image Preview 模型的图像生成技能,通过 inference.sh CLI 提供轻量级访问入口。该技能支持多种图像生成模式:
1. 文本生成图像:基础文生图能力,支持多种艺术风格(写实、插画、水彩、3D 渲染等)
2. 图像编辑:支持最多 14 张输入图像的局部编辑与重绘
3. 多图生成:单次请求可并行生成多张图像
4. Google Search 增强:开启后可将实时信息(天气、新闻等)融入图像生成
显著优点
- 官方模型直连:底层为 Google 官方 Gemini 3.1 Flash Image Preview,非第三方封装
- 灵活参数控制:支持自定义比例(1:1、16:9 等)、分辨率(最高 4K)、输出数量
- 多语言 SDK:提供 Python SDK 支持,支持流式输出进度
- 安全安装:CLI 安装脚本仅下载二进制文件并校验 SHA-256,无提权操作
潜在局限
- 依赖外部服务:需 inference.sh 平台账号,存在服务可用性依赖
- CLI 学习成本:非图形界面,需熟悉命令行操作
- 模型版本锁定:需指定完整 app ID(如
@0c7ma1ex),版本管理较复杂 - 生成质量波动:Flash 系列侧重速度,复杂场景下细节表现可能弱于 Pro 版本
适合人群
开发者、设计师、内容创作者等需要程序化调用图像生成 API 的技术用户,尤其适合已在使用 inference.sh 生态的现有用户。
常规风险
- API 密钥管理:需在 CLI 中登录,存在凭证泄露风险
- 内容合规:生成内容受 Google 使用政策约束
- 成本不可控:按调用次数计费,批量生成时需注意用量