Meta开源AI模型MusicGen 可将文本和旋律转化为完整乐曲

发布时间:2025-05-19 04:04:58

Meta 近日在 Github 上开源了其 AI 语言模型 MusicGen,开源该模型基于谷歌 2017 年推出的模型 Transformer 模型。如同模型名称所示,文本完整MusicGen 主要用于音乐生成,和旋化它可以将文本和已有的律转乐曲旋律转化为完整乐曲。

研发团队表示:“我们使用了 20000 小时的开源授权音乐来对训练该模型,并采用 Meta 的模型 EnCodec 编码器将音频数据分解为更小的单元进行并行处理,进而让 MusicGen 的文本完整运算效率和生成速度都比同类型 AI 模型更为出色。”

Meta开源AI模型MusicGen 可将文本和旋律转化为完整乐曲

除此之外,和旋化MusicGen 还支持文本与旋律的律转乐曲组合输入,例如你可以提出生成“一首轻快的开源曲目”并同时要求“将它与贝多芬的《欢乐颂》结合起来”。

研发团队还对 MusicGen 的模型实际表现进行了测试。结果显示,文本完整与谷歌的和旋化 MusicLM 以及 Riffusion、Mousai、律转乐曲Noise2Music 等其他音乐模型相比,MusicGen 在测试音乐与文本提示的匹配度以及作曲的可信度等指标上表现更好,总体而言略高于谷歌 MusicLM 的水平。

Meta 已允许该模型的商业使用,并在 Huggingface 上发布了一个供演示用的网页应用。

原标题:Meta 开源 AI 语言模型 MusicGen,可将文本和旋律转化为完整乐曲

网友评论(0)
暂时还没有人回复哦,抢沙发喽...
我想说两句(您的回复是对作者莫大的支持!)

您可能关注的热点新闻

喜欢黑骡子网,那就猛击分享吧!