使用说明

核心功能与用法

ElevenLabs Music 是一项基于 ElevenLabs 官方 API 的文本转音乐生成技能，允许用户通过自然语言描述直接生成完整音乐作品，包括带有人声和 AI 生成歌词的歌曲或纯器乐曲目。核心使用方式是通过 Python 脚本调用，支持 3 秒至 10 分钟（600 秒）的音频生成，默认输出 30 秒片段。

关键参数：

--length：控制时长（3-600 秒）
--instrumental：强制生成无歌词的纯音乐
--output：自定义输出路径

显著优点

1. 多语言 AI 人声：支持英语、西班牙语、葡萄牙语、德语、日语等多种语言的 AI 生成歌词与演唱
2. 风格覆盖广泛：从爵士、管弦乐、低保真嘻哈到巴西流行乐（MPB）、桑巴、波萨诺瓦等多元风格
3. 快速原型能力：几分钟内将文本描述转化为可试听音频，极大降低音乐创作门槛
4. 版权安全机制：API 内置内容过滤，拒绝直接提及艺术家姓名的提示，并提供替代建议

潜在局限与风险

付费门槛：必须使用 Creator 或更高级别付费计划，无免费试用层
生成质量波动：AI 音乐生成仍存在风格一致性、人声自然度、乐器分离度等不确定性
版权灰色地带：尽管有过滤机制，生成内容的版权归属及商用许可边界仍存争议
依赖外部 API：完全依赖 ElevenLabs 服务可用性与定价策略
提示工程要求高：需详细描述风格、年代、乐器、情绪等维度才能获得理想结果

适合人群

内容创作者（视频配乐、播客片头）
游戏开发者（快速生成原型背景音乐）
广告与营销团队（定制 jingle 与品牌音频）
音乐爱好者与业余作曲家（灵感探索、demo 制作）
多语言内容生产者（需特定语言人声场景）

常规风险提示

| 风险类别 | 说明 |

|---------|------|

| 订阅成本 | 持续付费要求，需评估 ROI |

| 版权合规 | 商用前需确认 ElevenLabs 最新使用条款 |

| API 依赖 | 服务中断或价格调整将直接影响可用性 |

| 输出不可控 | 相同提示可能产生差异较大的结果 |

| 环境配置 | 需正确设置 `ELEVENLABS_API_KEY` 并安装 `uv` 工具链 |

ai-music text-to-music elevenlabs vocals-generation audio-synthesis music-production content-creation multilingual

ElevenLabs Music 内容

scripts文件夹

手动下载zip · 3.7 kB

generate_music.pytext/plain

请选择文件