mulerouter - 一站式 AI 音视频创作引擎

使用说明

核心用法

MuleRouter 是一个面向多模态 AI 内容生成的 Agent Skill，通过统一的 Python 接口封装了 MuleRouter/MuleRun 平台的 API 能力。用户可通过简单的命令行调用实现 Text-to-Image、Image-to-Image、Text-to-Video、Image-to-Video 以及视频编辑（VACE、关键帧插值）等操作。

使用前需配置环境变量 MULEROUTER_API_KEY 及 MULEROUTER_BASE_URL 或 MULEROUTER_SITE，通过 uv 工具管理依赖。典型工作流程为：运行 list_models.py 查看可用模型 → 使用 --list-params 查看具体参数 → 执行生成命令获取结果 URL。该 Skill 支持本地图像路径自动转 base64，避免命令行长度限制。

显著优点

模型覆盖全面：集成 Alibaba Wan2.6 系列、Google Veo3/Nano Banana Pro、OpenAI Sora2、Midjourney 等业界领先模型，满足不同场景的创作需求。

接口设计统一：所有模型遵循一致的调用范式，降低学习成本。通过 uv run 一键执行，无需手动管理 Python 环境。

工程化程度高：代码采用模块化架构（core/ 核心层 + models/ 模型层），具备完整的类型注解、错误处理和重试机制（指数退避，最多 3 次）。

本地文件友好：自动将本地图像路径转换为 base64，既保留用户操作便利性，又规避了命令行参数长度限制。

潜在缺点与局限性

外部依赖强：必须持有 MuleRouter/MuleRun 平台的有效 API Key 且保持网络连通，无法离线使用。生成耗时较长（图像建议 5 分钟超时，视频建议 15 分钟），对实时性要求高的场景不适用。

成本不透明：作为第三方 API 聚合平台，实际调用成本取决于上游定价，Skill 本身未提供费用预估或限额查询功能。

输出可控性有限：AI 生成内容具有随机性，虽然支持参数调节，但无法保证输出完全符合预期，需多次迭代。

平台锁定风险：API 端点由 MuleRouter 控制，若平台策略调整或服务中断，Skill 功能将直接受影响。

适合的目标群体

内容创作者：需要快速生成视觉素材的自媒体运营者、短视频制作人
设计师与艺术家：探索 AI 辅助创意流程，进行概念验证和风格实验
开发者与产品经理：原型阶段需要快速生成演示素材，降低设计外包成本
教育与科研人员：用于教学演示、论文配图等场景

使用风险

性能风险：视频生成任务可能耗时数十分钟，长时间轮询会占用系统资源；建议根据任务类型设置合理超时。

依赖项风险：核心依赖 httpx、python-dotenv 等第三方库，需保持更新以修复潜在安全漏洞。

数据隐私：图像/视频内容需上传至 MuleRouter 服务器处理，敏感素材需谨慎评估合规性。

API 配额耗尽：高频调用可能触发速率限制或产生意外费用，建议实施调用监控。

content-media image-gen api automation productivity

mulerouter 内容

core文件夹

models文件夹

alibaba文件夹

wan2.1-kf2v-plus文件夹

wan2.1-vace-plus文件夹

wan2.2-i2v-flash文件夹

wan2.2-i2v-plus文件夹

wan2.2-t2v-plus文件夹

wan2.5-i2i-preview文件夹

wan2.5-i2v-preview文件夹

wan2.5-t2i-preview文件夹

wan2.5-t2v-preview文件夹

wan2.6-i2v文件夹

wan2.6-image文件夹

wan2.6-t2i文件夹

wan2.6-t2v文件夹

google文件夹

nano-banana文件夹

nano-banana-pro文件夹

veo3文件夹

midjourney文件夹

diffusion文件夹

video文件夹

openai文件夹

sora2文件夹

references文件夹

scripts文件夹

tests文件夹

手动下载zip · 52.4 kB

__init__.pytext/plain

请选择文件