ElevenLabs Music v2 支持连贯的风格切换
The Decoder··作者 Matthias Bastian
关键信息
Music v2 为 ElevenMusic、ElevenAPI 和 ElevenCreative 提供能力,API 价格为每分钟 0.15 美元,最长支持 5 分钟,音频质量为 44.1 kHz、128–192 kbps。ElevenLabs 表示该模型仅使用授权数据训练,并通过与音乐公司 Believe 的合作获取部分数据,且从 Starter+ 方案开始生成曲目可用于商业用途。
资讯摘要
ElevenLabs 推出了 Music v2,这是其 AI 音乐生成模型的新版本。公司表示,新模型在不同风格下的人声、乐器和编曲表现都更好。最引人注目的能力之一,是同一首歌可以从歌剧平滑切换到重金属,同时还能处理高速说唱并加入音效,而且不会破坏整体连贯性。这说明该系统的目标不只是生成短循环片段,而是更偏向于结构化、长篇幅的音乐生成。Music v2 还新增了改进版 inpainting,也就是可以只重生成歌曲中的某一段,而不是修改整首作品。公告称,用户现在可以按段落逐步构建歌曲,从而更方便地做定点修订。
多语言支持也得到了升级。该模型将用于三个产品:面向音乐人的 ElevenMusic、面向开发者的 ElevenAPI,以及面向品牌和内容团队的 ElevenCreative。ElevenLabs 还给出了 API 定价,为每分钟 0.15 美元,最长支持 5 分钟,音频输出为 44.1 kHz、128–192 kbps。公司表示,Music v2 只使用授权数据训练,其中一部分来自与音乐公司 Believe 的合作。从 Starter+ 套餐开始,生成的曲目即可用于商业用途。

资讯正文
ElevenLabs Music v2 承诺在不失去音乐连贯性的情况下实现从歌剧到金属的过渡
ElevenLabs 发布了 Music v2,这是一款升级版的 AI 音乐生成模型。它在所有音乐类型中都能带来更好的演唱、人声编配和编曲。单首歌曲可以在歌剧和重金属之间切换,处理高速说唱,并嵌入音效,而且不会失去连贯性。
另一个新增功能是改进后的 inpainting。用户现在可以只重新生成歌曲的特定片段,而不会影响其余部分。歌曲可以按乐段逐段构建。多语言支持也得到了升级。
Music v2 为三个平台提供动力:面向音乐人的 ElevenMusic、面向开发者的 ElevenAPI,以及面向品牌和内容团队的 ElevenCreative。API 定价为每分钟 0.15 美元,最长时长为 5 分钟,音频质量为 44.1 kHz、128-192 kbps。
据 Elevenlabs 称,该模型仅使用授权数据进行训练,部分数据来自与音乐公司 Believe 的合作。所有生成曲目自 Starter+ 套餐起即可用于商业用途。可在此处试用。
来源与参考