使用说明

核心用法

本技能通过调用 inference.sh CLI（infsh）提供 AI 音乐生成能力，整合了 Diffrythm（快速歌曲生成）和 Tencent Song Generation（带人声完整歌曲）两大模型。用户需先通过 curl -fsSL https://cli.inference.sh | sh 安装 CLI 并完成登录认证，随后即可通过简单的 Bash 命令生成音乐。支持文本生成音乐（text-to-music）、歌词转歌曲、器乐曲创作等多种模式，可通过 JSON 参数精确控制生成内容的风格、情绪和结构。

显著优点

该技能的最大优势在于其零代码门槛和多场景适用性。无需编写复杂代码，仅需简单的命令行操作即可生成专业级音频内容。Diffrythm 模型适合快速生成背景音乐和短音频，而 Tencent Song Generation 则能创作带有人声的完整歌曲，满足不同创作需求。生成内容属于免版税音乐（royalty-free），可直接用于社交媒体视频、播客片头、游戏配乐、广告音频等商业场景，避免了传统音乐授权的法律风险。此外，技能提供了丰富的提示词模板，涵盖流派（流行、电子、古典等）、情绪（欢快、史诗、神秘等）和乐器配置，帮助用户快速获得理想的音频效果。

潜在缺点与局限性

首先，该技能完全依赖外部服务，所有音乐生成任务都通过 inference.sh 云平台完成，需要稳定的网络连接，无法离线使用。其次，安装流程存在门槛，虽然 curl | sh 的安装方式简洁，但对安全敏感的用户可能需要手动审查安装脚本，且需要单独注册和配置 inference.sh 平台的 API 密钥。再者，作为 T3 来源（个人开发者发布的工具），其长期维护稳定性和安全更新频率不如企业级产品。此外，生成质量受限于底层模型的能力，对于复杂编曲或特定风格的音乐，可能需要多次尝试调整提示词才能获得满意结果。

适合的目标群体

本技能特别适合内容创作者（YouTube/TikTok 视频制作人、播客主播）、独立游戏开发者（需要低成本游戏配乐）、社交媒体运营者（需要品牌音效和广告音乐）以及AI 艺术爱好者。对于熟悉命令行操作、希望快速获得免版税音频素材的用户而言，这是 Suno 和 Udio 等商业产品的轻量级替代方案。同时，也适合需要将音乐生成功能集成到自动化工作流中的开发者，可与视频生成、文本转语音等技能组合使用。

使用风险

供应链安全风险：安装脚本通过 curl | sh 管道执行，虽为标准做法，但建议先下载审查脚本内容再执行。数据隐私风险：音乐生成提示词和生成的音频内容会传输至 inference.sh 第三方服务器，敏感商业内容需谨慎处理。服务依赖风险：作为纯文档型技能，其实际功能完全依赖外部 CLI 和云服务，若 inference.sh 服务中断或变更 API，技能将失效。合规风险：尽管标榜免版税，但 AI 生成音乐的版权归属在不同司法管辖区存在法律不确定性，商业使用前建议咨询法律意见。成本控制：虽然技能本身免费，但 inference.sh 平台可能对 API 调用收费，需关注账户额度和费用。

安全解读

核心用法

AI Music Generation 是一个纯文档型 Skill，本身不包含可执行代码，而是通过封装 inference.sh 平台的 CLI 调用方式，为用户提供便捷的 AI 音乐生成能力。用户需先安装 infsh CLI 工具，然后通过简单的命令行指令调用两种核心模型：Diffrythm（infsh/diffrythm）适合快速生成器乐曲目，Tencent Song Generation（infsh/tencent-song-generation）则支持生成包含人声的完整歌曲。

使用流程简洁：安装 CLI → 登录账户 → 通过 infsh app run 命令传入 JSON 格式的 prompt 参数即可生成音频。对于需要自定义歌词的歌曲生成，支持先通过 --save 导出模板 JSON，编辑后再执行。这种设计使得音乐生成可以无缝嵌入自动化工作流或脚本中。

显著优点

1. 双模型覆盖：Diffrythm 主打速度，适合快速迭代背景音乐；Tencent Song Generation 支持人声，满足完整歌曲创作需求，形成互补。
2. 场景广泛：官方示例覆盖播客片头、游戏 8-bit 音乐、影视配乐、Lo-Fi 学习音乐、社交媒体背景音等多种垂直场景，实用性强。
3. 零代码依赖：纯文档封装，无额外运行时依赖，仅需 inference.sh CLI 即可运作，维护成本低。
4. 工作流友好：命令行接口便于与视频生成、语音合成等 Skill 串联，构建端到端内容生产管道。

潜在缺点与局限性

1. 外部服务锁定：核心功能完全依赖 inference.sh 平台的可用性与定价策略，若平台调整服务或价格，Skill 功能将直接受影响。
2. CLI 安装风险：采用 curl | sh 管道安装方式，虽为行业标准，但存在潜在的供应链安全风险，且未提供包管理器等备选方案。
3. 版权与授权模糊：生成内容的版权归属、商业使用授权范围在文档中未明确说明，对于商业项目需谨慎评估。
4. 无离线能力：必须联网调用云端 API，无法本地运行，对网络环境有硬性要求。
5. 提示词依赖：输出质量高度依赖 prompt 工程，缺乏精细的参数控制（如 BPM、调性、结构细分）。

适合人群

内容创作者：YouTube/TikTok 博主、播客主需要快速获取免版税背景音乐
独立游戏开发者：需原型阶段低成本游戏配乐
广告与营销从业者：制作短视频广告片头、品牌音效
AI 工作流构建者：希望将音乐生成集成到自动化内容生产链路的开发者

常规风险

数据隐私：生成提示词与歌词内容会传输至 inference.sh 服务器，敏感主题需谨慎
服务连续性：依赖单一第三方平台，存在服务中断或 API 变更风险
生成内容一致性：AI 音乐生成存在随机性，同一 prompt 可能产出风格差异较大的结果，需多次尝试
许可证缺失：Skill 自身未声明开源许可证，存在合规隐患

content-media audio ai-generation productivity music-production automation

ai-music-generation 内容

手动下载zip · 1.8 kB

SKILL.mdtext/markdown

请选择文件