使用说明

nvidia-image-gen 是一款调用 NVIDIA FLUX 系列模型的图像生成与编辑技能，提供两种核心工作模式：

文生图模式：通过 dev（高质量）或 schnell（快速）模型，将文本描述转换为图像。支持自定义分辨率、宽高比（1:1、16:9、9:16、4:3、3:4）、扩散步数和随机种子，满足从社交媒体配图到专业设计的多样化尺寸需求。

图生图模式：利用 kontext 模型对现有图像进行智能编辑，用户只需描述修改意图（如"添加太阳镜""更换背景为日落"），即可实现精准的局部或全局调整。

所有操作通过命令行脚本完成，输出结果以 MEDIA:: 协议路径返回，可直接嵌入对话流。

1. 模型权威性：底层依托 NVIDIA 官方 FLUX 模型，在图像质量、文本理解和生成稳定性方面处于行业第一梯队，尤其适合需要高保真度的商业场景。

2. 灵活的参数控制：从快速草图（schnell 模型）到精细成品（dev 模型），从固定比例到自定义尺寸，覆盖从概念验证到最终交付的全流程。

3. 低门槛集成：纯 Python 实现，仅依赖 requests 和标准库，部署简单；命令行接口设计直观，非技术用户也能快速上手。

4. 可复现性：通过固定随机种子，确保同一提示词多次生成结果一致，便于设计迭代和版本管理。

1. 网络依赖：所有计算均在 NVIDIA 云端完成，无法离线使用，且受 API 服务可用性制约。

2. 成本不透明：硬编码 API 密钥可能涉及开发者账户的配额消耗，用户难以预估实际调用成本。

3. 编辑功能局限：kontext 模型虽支持图像编辑，但复杂场景下的指令遵循精度和区域控制能力弱于专业图像编辑软件。

4. 输出可控性：生成结果受模型随机性影响，特定风格或细节可能需要多次尝试才能满足要求。

安全解读

NVIDIA Image Generation 是一款调用 NVIDIA 官方 FLUX 模型的 AI 图像生成工具，提供命令行接口实现两类核心功能：

文生图（Text-to-Image）：支持 dev（高质量）和 schnell（快速）两种模型，可通过自然语言描述生成图像。内置多种预设宽高比（1:1、16:9、9:16、4:3、3:4），支持自定义分辨率、扩散步数（steps）和随机种子，便于复现结果。

图生图/图像编辑（Image Editing）：基于 kontext 模型，允许用户上传现有图像并通过文本指令进行编辑（如"添加墨镜""将背景改为日落"）。

基本调用格式简洁：python scripts/generate.py "提示词" [选项]，输出结果为可直接发送聊天的图片路径。

| 风险类别 | 等级 | 说明 |

|---------|------|------|

| 凭证泄露 | 🔴 严重 | 硬编码 API 密钥可被提取滥用 |

| 数据外泄 | 🟡 中等 | 用户提示词和图像上传至第三方服务器 |

| 合规风险 | 🟡 中等 | 需确保用户知情同意数据传输 |

| 供应链安全 | 🟢 低 | 依赖纯净，无已知 CVE |

关键建议：使用前务必修改代码移除硬编码密钥，改用环境变量 NVIDIA_API_KEY 自行配置专属凭证。

scripts文件夹

手动下载zip · 4.7 kB

generate.pytext/plain

请选择文件