核心功能
Nano Banana Pro 是一款面向 OpenClaw 和 Ching Tech OS 平台的 AI 图像生成技能,封装了 Gemini Image API 的调用能力,提供文本生图与图像编辑双模式。
核心用法
- 文生图:通过
--prompt描述生成图片,支持1K/2K/4K三种分辨率 - 图生图:使用
-i参数传入单张或多张(最多 14 张)参考图进行编辑或融合 - 自动降级:当首选模型
gemini-2.5-flash-image失败时,自动回退至gemini-2.0-flash-exp-image-generation - 依赖管理:强制使用
uv run执行,确保 Python 依赖环境隔离
显著优点
1. 模型鲁棒性:内置多模型 fallback 机制,降低单点故障风险
2. 多图合成:支持最多 14 张图片输入,适合复杂场景构建
3. 分辨率灵活:从快速预览(1K)到高质输出(4K)三档可选
4. 平台集成:针对 OpenClaw 优化,输出带 MEDIA: 标记便于自动附件识别
局限与风险
- 环境依赖:必须预装
uv并配置GEMINI_API_KEY,无密钥则完全不可用 - 执行约束:严禁直接使用
python3,否则依赖缺失导致失败 - 平台限制:官方仅认证
openclaw和ching-tech-os两个平台 - 无安全审计:技能简介明确标注"未执行安全扫描",代码可信度依赖作者声誉
适合人群
- OpenClaw 生态用户,需要快速集成 Gemini 图像能力的开发者
- 对模型稳定性有要求、不愿手动处理 API 错误的自动化场景
- 需要批量多图合成的工作流(电商、设计预览等)
风险提示
- 外部 API 调用存在数据隐私风险,敏感图片请勿上传
- 自动降级逻辑透明但不可自定义重试次数或超时策略
- 项目处于早期版本(0.4.0),API 变更可能导致破坏性更新