如何使用 Meta 的 MusicGen 制作人工智能音乐

0 Shares

Meta 公司近日公开了 MusicGen 的源代码，这是一款全新的人工智能音乐生成工具，它能够将文本描述转化为动听的旋律。你可以在网上找到相关的演示，只需使用浏览器即可体验。生成的效果相当不错，更重要的是，它充分展示了人工智能音乐模型所取得的巨大进展。

接下来，本文将为你详细介绍 MusicGen 以及如何使用它来生成音乐。

什么是 MusicGen？

2023 年 6 月，Meta 发布了 MusicGen，这是一种基于人工智能的音乐生成模型。虽然它并不是第一家致力于解决从文本描述生成原创音乐这一复杂问题的公司，此前已经有 OpenAI 的 Jukebox 和 Google 的 MusicLM 可以生成音乐或歌曲片段。

但 MusicGen 的独特之处在于它是第一个开源的模型，这意味着如果你拥有至少 16GB 显存的 GPU，就可以在本地计算机上运行它，而实际上，我们发现即使 11GB 的显存也足够运行该模型。

如果你没有所需的硬件，也不必担心，因为你可以在浏览器上免费试用 MusicGen 的在线应用。通过在线演示，你大约需要一分多钟的时间就可以生成一个 12 秒左右的音频片段。

根据 Meta 官方的说法，MusicGen 可以生成高质量的音乐样本，尽管研究人员将其定义为 32kHz 的音质。这介于语音合成（16kHz）和数字音乐标准（44.1kHz）之间。

实际上，该音频的质量并不符合你在广播或流媒体平台上听到的最低标准。然而，与其他人工智能音乐生成器相比，并考虑到目前的整体技术水平，其音频质量相当不错，并且文件中的噪声水平较低。

音乐与提示的匹配程度如何呢？通过聆听我们在下面生成的示例，你可以很快了解这一点。总体而言，它在保持流行音乐风格的同时，相较于此前的模型，其音乐结构更加连贯。

MusicGen 非常易于使用，无需注册。其界面也十分简洁，用户可以轻松上手并享受乐趣。

以下是使用 MusicGen 生成音乐的方法：

在名为“描述你的音乐”的文本框中，输入你的提示。你可以尝试一些简单的描述，例如“爱尔兰民谣”，也可以通过加入乐器、节奏、流派或情感等更详细的元素来使其更具体。

点击“生成”按钮开始生成过程。一两分钟后，右侧的“生成的音乐”模块中将出现一个音频播放器。

将鼠标悬停在模块上以显示播放器控件并收听文件，或者单击右上角的下载图标将文件保存到你的电脑。请注意，它只能以 .mp4 文件格式下载。

如果你想尝试使用现有的旋律来调整生成结果，你可以在文本框旁边的模块中上传音频文件。你也可以选择“麦克风”选项，使用麦克风录制旋律。

对旋律的调整将以你的文本描述和你提供的旋律作为参考。这对于微调 MusicGen 的生成结果非常有用。

MusicGen 的代码在 MIT 许可下免费发布，几乎没有任何限制。至于使用该模型生成的音频，目前尚不清楚是否有任何法律约束。值得注意的是，Meta 提出了关于使用 MusicGen 的警告：

“该模型不应被用于故意创作或传播会给人们带来敌对或疏远感的音乐作品。这包括制作可能会使人感到不安、痛苦或冒犯的音乐，或传播带有历史或当前刻板印象的内容。”

Meta 进一步解释说，MusicGen 是面向希望探索人工智能音乐生成的研究人员，而不是用于“下游应用”，他们认为“下游应用”指的是将人工智能音乐上传到流媒体平台并进行分发等活动。

这些道德方面的考虑反映了人工智能艺术创作所面临的普遍问题。如何在训练人工智能模型时获得数据使用许可，以及如何对艺术家进行适当的补偿或署名，这些问题是 Meta 谨慎行事的原因所在。

简而言之，以娱乐为目的探索该模型不太可能造成损害，但如果涉及到将生成的音频用于商业音乐，情况可能会更加复杂。很多人都想知道人工智能流行音乐的未来会是什么样子。

总的来说，Meta 发布了 MusicGen，这是一个开源的人工智能模型，能够根据简单的文本描述生成原创音乐，为现有音乐生成模型又增添了一种新的选择。如果你对体验这项技术感到好奇，只需使用网络浏览器即可试用演示。