使用说明

核心用法

本技能集成阿里万相（Wan）系列视觉生成模型，提供五大核心能力：

1. 文生图（text2image）
通过文本描述生成高质量图像，支持1-4张批量输出，分辨率可选1280×1280等多种规格，适用于创意视觉设计、营销素材制作。

2. 图生图编辑（image-editting）
支持1-4张参考图融合编辑，可结合风格迁移、背景替换等复杂指令，实现精准的图像重绘与创意合成。

3. 文生视频（text2video）
根据文本生成长达15秒的高清视频，支持720P/1080P分辨率，采用异步任务模式，适合短视频、广告片头生成。

4. 图生视频（image2video）
以单张图片为首帧驱动视频生成，保持视觉一致性同时赋予动态叙事能力，适用于产品展示、场景动画。

5. 参考驱动视频（reference2video）
高级功能，支持多角色（character1/2/3...）绑定，融合人物照片、视频片段、物体图像等多模态参考，生成角色一致性强的剧情视频，支持单镜头/智能多镜头切换。

---

显著优点

效果领先：万相模型在国际评测中表现优异，中文语义理解深度适配
功能全面：覆盖图像生成→编辑→视频制作的完整工作流
角色一致性：reference2video支持多角色绑定，解决AI视频角色漂移痛点
灵活输入：同时支持HTTP URL与本地文件（自动转base64）

潜在局限

视频生成采用异步轮询模式，需额外查询任务状态
参考驱动视频单任务最多支持3个视频+5张图，复杂场景需拆分
高分辨率/长时长生成耗时较长，成本相应增加
依赖阿里云DashScope API，需有效AK密钥

适合人群

视觉设计师、短视频创作者、电商运营、AI艺术探索者、广告制作团队

常规风险

API密钥泄露风险：DASHSCOPE_API_KEY需妥善保管
内容合规风险：生成内容需符合国内AI生成内容管理规定
版权模糊地带：参考素材的商用授权需自行确认

安全解读

核心功能

该Skill基于阿里云Wan系列多模态生成模型，提供完整的AI视觉内容创作能力：

文生图(text2image)：根据文本描述生成高质量图像，支持512-1440像素多种分辨率，单次最多生成4张
图生图(image-edit)：基于1-4张参考图进行风格融合、场景重构等智能编辑
文生视频(text2video)：将文本转化为5-15秒动态视频，支持720P/1080P分辨率
图生视频(image2video)：以静态图为首帧生成动态视频，实现"让图片动起来"
参考生视频(reference2video)：最具特色的功能，支持上传人物照片/视频作为角色参考，生成保持角色一致性的新视频场景，支持多角色、多物体复杂交互

显著优点

| 维度 | 优势说明 |

|------|---------|

| **模型能力** | Wan系列为阿里集团自研开源模型，全球范围内广泛采用，生成质量达到业界SOTA水平 |

| **功能完整** | 覆盖图像→视频全链路创作，尤其reference2video功能可实现角色一致性视频生成，解决AI视频"换脸不换装"痛点 |

| **使用灵活** | 同时支持URL远程资源与本地文件，图片自动base64编码处理 |

| **基础设施** | 依托阿里云DashScope平台，API稳定性与并发能力有保障 |

| **安全合规** | 代码通过A级安全认证，无危险函数，密钥通过环境变量管理 |

潜在局限

1. 任务异步模式：视频生成采用"提交-轮询"异步机制，需手动查询任务状态，无法实时获取结果
2. 参考资源限制：reference2video最多支持5个图像+3个视频（总计<5个），复杂场景需精简素材
3. 网络依赖强：所有生成逻辑依赖阿里云API，离线环境无法使用
4. 成本因素：高质量视频生成消耗较多Token，高频使用需关注费用
5. 分辨率限制：图像生成最大1440×1440，视频最高1080P，4K内容暂不支持

适合人群

内容创作者：快速生成社交媒体配图、短视频素材
电商运营：批量生成商品场景图、动态展示视频
开发者/产品经理：原型视觉快速验证、AI应用Demo搭建
教育/培训机构：课件配图、动画素材制作

常规风险

数据外发：提示词、图片/视频内容需上传至阿里云服务器处理
版权合规：生成内容可能涉及训练数据版权问题，商用需关注平台条款
内容审核：AI生成内容需符合国内网络内容监管要求
API密钥管理：需妥善保管DASHSCOPE_API_KEY，避免泄露

ai-generation image-generation video-generation text2image text2video image2video alibaba-cloud wan-models content-creation

Wan Image and Video Generation and Editting 内容

references文件夹

scripts文件夹

手动下载zip · 22.2 kB

wan2.6-i2v-api-doc.mdtext/markdown

请选择文件