您还在为想听音乐时找不到自己喜欢的歌曲而烦恼吗?现在您可以在几分钟内制作一首自己的歌曲。
近年来,由于生成式人工智能技术的显着进步,生成式音乐已成为下一个追逐的热门话题。过去有广受好评的Suno,国内大型模型厂商也纷纷效仿。北京时间4月3日,开源生成AI公司Stability AI宣布推出音频生成模型Stable Audio 2.0。之前的1.0版本于2023年9月首次亮相,被《时代》杂志评为2023年最佳发明之一。
目前AI生成音乐的实现主要依靠深度学习技术。就像语言模型是在大量文本上进行训练一样,音频模型也是在大量的音乐数据上进行训练,让AI能够理解音乐的结构、风格和创作规则,进而生成新的音乐。
据Stability AI官方博文称,Stable Audio 2.0使用AudioSparx数据进行训练,该数据包含超过80万个音频文件,涵盖音乐、音效和单个乐器的声音素材,以及相应的文本描述信息。
Stable Audio 2.0 仅使用自然语言描述即可生成长达三分钟的高质量44.1 kHz 立体声完整音乐。该数字表示音频信号的采样频率。采样率越高,越能捕捉到声波的细微变化,录制的声音也越接近原声。 44.1 kHz 是CD 品质的标准采样率,可提供高音质。
除了直接用文字生成音乐外,用户还可以先上传一段音频,然后用文字描述想要的效果。 Stable Audio 2.0可以根据指令对音频进行转换,这意味着它具有将音频转换为音频的能力。此外,它还可以产生特定的音效,使得创作非常灵活。
图|稳定的音频2.0用户界面(来源:官网)
具体使用时,在“提示”部分输入您想要生成音乐的关键字,然后点击下面的“生成”即可开始生成。免费版本的用户每月可以生成10次,如果想使用更多,每月至少需要支付11.99美元。
值得注意的是,Stable Audio 2.0尚不支持歌词。为了充分检验AI生成音乐的水平,这里需要提到另一款AI音乐产品Suno。
Suno在今年3月底迎来了重要升级。最新的V3版本被广泛认为是音乐界的“ChatGPT时刻”。它可以在几秒钟内产生不同风格和流派的歌曲,效果几乎可以与人类创作的音乐相媲美。 Suno在之前的公告中还提到,V4版本已经在开发中,将会有一些令人兴奋的新功能。
图| Suno用户界面(来源:官网)
Suno相对来说更加人性化,每天可以免费使用5次。一次生成两首歌曲。歌曲时长为2分钟。有两种使用方法。一种是输入歌词,然后输入音乐类型和主题,生成歌曲。另一种是生成纯音乐,只用文字来描述你想要的歌曲。
正值清明节,笔者尝试以清明节必读诗词《清明》为蓝本,进行实际测试看看效果,并与前不久同样升级的AI音乐产品Suno进行对比。如果你之前没有接触过AI音乐,你一定会对它的表现感到惊讶。首先,我使用ChatGPT改编唐诗《清明》来生成歌词。将歌词输入Suno,稍等片刻,歌曲就会生成。效果如下:
实际效果还是相当不错的。接下来使用Stable Audio 2.0生成类似提示词的音乐。效果如下:
2 清明雨落,温馨之声,3分钟
我个人对Stable Audio 2.0的效果不太满意。不过不同的人对音乐有不同的看法,也可以在实践中检验一下效果。
值得一提的是,除了上述两款产品外,近期国内也发布了一款名为SkyMusic的大型音乐模型工具,可以在天宫APP上试用(目前需要加入微信群获取邀请码) ,可在软件界面操作)。其用户界面如下:
输入歌词后可以直接生成音乐,也可以选择现有的歌曲作为参考来生成。一次会生成3首歌曲,时长约90秒。这里我们先用我们刚刚生成的《清明雨纷飞》歌词直接生成。比较好的结果之一如下:
然后,用参考音乐再次生成它。参考音乐是上面Suno生成的歌曲。效果如下:
有了参考音乐后,我个人感觉新生成的音乐水平较高,三首歌的效果都不错。
总的来说,以上三款产品中,Suno的效果无疑是最好的,可以以假乱真(歌词写得越好,效果应该会更好)。不过Suno目前还存在一个问题,就是生成的音乐不完整,总是在两分钟就突然结束,结束得很突然。
无论如何,可以预见的是,在不久的将来,AI音乐将会流行起来,并且可以大规模商业化。例如,影视剧中的背景音乐可以通过AI快速高效地制作出来,满足特定场景的情感需求。在音乐市场中,人工智能可以根据用户的聆听历史和喜好创作个性化音乐,为我们提供更加定制化的聆听体验。音乐市场的消费模式可能正在发生变化。
随着AI在内容生成方面不断“攻城略地”,从文本到视频,AI可以极大丰富人类的创造力,让每个人都成为创造者。这不仅让艺术家发现了新的创作方法,也给了普通人成为艺术家的可能性。
人工智能无疑已成为当今创新的前沿。技术的进步使人工智能能够接近理解和模拟人类的创作过程。人工智能可以作为一种工具,帮助人们实现创造力的无限扩展。这一应用挑战了我们对艺术创作的传统理解,引发了关于创造力、艺术价值和作者身份的深刻讨论。但不可否认的是,人工智能在内容生成领域的应用开启了人类创造力的新篇章。
头图:DALL·E生成《清明节》
参考:
https://stability.ai/news/stable-audio-2-0?utm_source=网站utm_medium=twitterutm_campaign=博客
https://www.suno.ai/blog/v3