vgl

🎨 Bria官方图像生成结构化提示规范

Bria官方VGL格式规范文档,将自然语言图像描述转化为确定性JSON结构,确保AI图像生成的可控性与可复现性。

收藏
8.3k
安装
2.8k
版本
v1.2.1
CLS 安全性认证2026-05-03
点击查看完整报告 >

使用说明

核心用法

VGL(Visual Generation Language)是Bria FIBO图像生成模型的结构化提示语言。该Skill作为纯文档型工具,指导用户将模糊的自然语言描述转化为精确的JSON格式,涵盖图像生成的全部视觉维度:主体对象、光照条件、摄影参数、美学风格等。支持五种操作模式:Generate(新建图像)、Edit(标准编辑)、Edit_with_Mask(蒙版区域填充)、Caption(图像描述)、Refine(优化现有JSON)。

显著优点

1. 确定性输出:JSON结构消除自然语言的歧义,确保相同输入产生一致结果
2. 细粒度控制:11个核心字段覆盖从镜头焦距到人物表情的全维度参数

3. 专业级规范:针对人像摄影提供专门的构图建议(如85mm人像镜头、中景/特写规范)

4. 编辑保真:明确的Fidelity规则确保编辑时仅修改指定属性,保留其他视觉特征

5. 与API无缝衔接:生成的JSON可直接用于bria-ai Skill的structured_prompt参数

潜在缺点与局限性

1. 学习成本陡峭:需掌握完整的JSON Schema和VGL术语体系,非专业用户上手困难
2. 对象数量限制:最多5个objects,复杂场景需精简描述

3. 无实际执行能力:仅为格式规范文档,必须配合bria-ai Skill或Bria API才能生成图像

4. 英文原生设计:所有字段和示例均为英文,中文用户需额外转换

5. 创意约束:过度结构化可能限制生成模型的创意发挥空间

适合的目标群体

  • AI图像生成专业用户、提示词工程师
  • 需要批量生成一致风格图像的商业设计团队
  • 电商产品摄影、广告创意领域的视觉从业者
  • 对图像生成有精确控制需求的开发者

使用风险

  • 依赖风险:必须配套使用bria-ai Skill,单独使用无实际产出
  • 版本同步风险:VGL Schema可能随Bria模型更新而变化
  • 过度工程化风险:简单场景使用VGL可能得不偿失

安全解读

核心功能

VGL(Visual Generation Language)是专为Bria FIBO图像生成模型设计的结构化提示语言。该Skill将模糊的自然语言图像描述转化为确定性的JSON Schema,显式声明每一个视觉属性——从物体位置、光照条件到相机参数,彻底消除传统文本提示的歧义性。

显著优势

精确控制与可复现性:相比Stable Diffusion或DALL-E的开放式文本提示,VGL通过结构化字段强制规范输出,确保多次生成结果的一致性。例如photographic_characteristics.lens_focal_length明确要求"85mm portrait"而非模糊的"professional photo"。

多模式支持:覆盖Generate(文生图)、Edit(图生图)、Edit_with_Mask(局部重绘)、Caption(反推描述)、Refine(提示词优化)五种工作模式,满足从创意生成到精细调修的全流程需求。

专业级摄影参数:内置完整的摄影语法——景深、对焦、机位角度、镜头焦段、布光方向等,使非摄影师用户也能输出行业标准的图像规格描述。

智能保真机制:标准编辑模式自动继承原图所有未修改属性,遮罩编辑模式确保填充内容与未遮罩区域无缝融合,避免AI常见的"整体重绘失控"问题。

潜在局限

学习曲线陡峭:11个必填字段、嵌套对象结构、大量枚举值约束,对 casual 用户不够友好。快速实验场景下,传统自然语言提示效率更高。

Bria生态锁定:VGL为Bria AI专有格式,无法直接迁移至Midjourney、Stable Diffusion等竞品平台,存在供应商锁定风险。

对象数量限制objects数组硬性限制最多5个元素,复杂场景需人工精简优先级,可能遗漏边缘细节。

文本渲染保守text_render字段默认强制为空,仅当用户提供精确文本内容时才填充,虽避免幻觉但也限制了含文字创意图的便捷生成。

适合人群

  • 品牌/电商设计师:需要批量生成风格统一的商品图、模特图
  • 广告公司创意总监:追求像素级控制的商业摄影替代方案
  • AI工作流工程师:构建可复用的图像生成Pipeline
  • 对Midjourney随机性不满的专业用户

常规风险提示

1. API成本:Bria为商业云服务,高频调用需关注token消耗
2. 版权合规:生成人物肖像需确认Bria训练数据来源的商用授权范围

3. 结构化提示词膨胀:复杂场景的JSON可能超过API长度限制,需合理拆分

4. 与bria-ai Skill依赖:VGL本身仅生成提示词,实际生图需配合执行类Skill使用

使用建议

建议与bria-ai Skill组合使用:vgl负责"写剧本",bria-ai负责"执行拍摄"。对于已有图像的二次编辑,优先使用Refine模式保留种子一致性。

vgl 内容

references文件夹
手动下载zip · 7.8 kB
schema-reference.mdtext/markdown
请选择文件