首页 AI音频音乐 只需几秒钟即可生成一首2 分钟的歌曲! 4位尖子生带来超一流的AI音乐工具 以后想听什么就写什么

只需几秒钟即可生成一首2 分钟的歌曲! 4位尖子生带来超一流的AI音乐工具 以后想听什么就写什么

标题:只需几秒就可生成2分钟歌曲!4个学霸带来王炸级AI音乐工具,以后想听什么自己写

城石互动记者童薇

“二月杨柳醉春烟,三月山色绿草如茵,天下最美的天空是四月,江里泉水绿如蓝……”

首先让我听一首歌,新演奏的抒情版本《上春山》。

如果我说我只用了不到1分钟就完成了作文部分,你信吗?

生成式人工智能还有另一个热门产品:输入几个提示词,比如内容主题、音乐流派风格,或者直接喂给AI一首古诗词,等待几秒到几十秒,它就可以生成一首古诗词。长达一年的歌曲。两分钟的歌。而且,目前无需排队申请,登录后即可直接开始免费试用。

资深媒体人、著名电台DJ杨越尝试过Suno后,不禁在朋友圈感叹:“自去年12月AIGC热潮兴起以来,我一直对音乐保持着最后的乐观态度。”我已经从事了近30年的行业,我认为人工智能替代人类创作音乐还是比较困难的。” “直到昨晚,我尝试了AI音乐工具Suno的V3版本,这是我用它测试的第一首歌,当时我的心情很复杂。我很兴奋人工智能真的可以代替人制作音乐,但我失望的是音乐创作和表达技术可能会被颠覆,行业也会发生变化……”

AI音乐的ChatGPT是时候了?

Suno 是一家位于马萨诸塞州剑桥的人工智能初创公司,本周发布了Suno 模型的V3 版本。任何人,即使五音不全,没有音乐创作技巧,只需要简单的文字提示,就可以在几秒钟内创作出一首长达2分钟的歌曲。

打开官方网站(https://app.suno.ai/)。主页上有各种官方示例:制作一首关于月亮的歌曲,制作一首关于妈妈的烹饪的歌曲,制作一首关于你的金鱼的歌曲。歌曲……

他们还为用户创建和提交的人工智能歌曲创建了排名。目前上榜的热门歌曲中,不乏中文曲目。《水调歌头(明月几时有)》使用提示词“中国传统民乐、慢板、空灵、天使之声”生成,挤进前三名。

排名第六的《宫保鸡丁》是昨天创作的,用户上传的歌词居然是完整的菜谱!

我决定自己尝试一下。

首先,播放一首舒缓的情歌,输入提示:一首流畅的嘻哈歌曲,关于想和你在一起(一首流畅的嘻哈歌曲,关于想和你在一起)。

在红色框中输入提示词,然后按右侧黄色创建按钮即可生成。

二十多秒后,苏诺生成了男女两个版本的声音。嗯,听起来不错。

让我们再试试我们的中文水平吧。直接将李白的七字歌行《将进酒》“喂”给AI,“若不见,黄河之水天上来,奔流到大海,一去不复返……”指定嘻哈流行风格。您对生成的结果有何看法?

这个周末,国内外社交平台上的网友们都玩转了Suno,甚至将其与ChatGPT(生成歌词)、Midjourney(生成歌曲封面)、Runway gen2(生成歌曲MV图像)等AI工具结合使用。

有人喂了周杰伦的歌词,表示对生成的结果非常满意;有人惊呼AI音乐的ChatGPT时刻是否已经到来?有人说,古诗词如果能用这种形式来唱,小时候就背不下来了。太难了.

经过多次试验,一些专家总结出了一套理想的提示词模式:音乐流派(如Kpop、重金属)、音乐风格(如慢速、百老汇)、情感(如悲伤、愤怒)、乐器(如如钢琴、吉他)、主题或场景、声音描述(如愤怒的男声、悲伤的女声)。

目前,Suno向所有人开放免费试用,每人每天将获得50积分。同时制作2首具有相同提示词的歌曲消耗10点。因此,每天可以创作10首具有5个内容主题的歌曲。

4位学霸创始人

我希望每个人都能创作出专业水平的歌曲

过去一年多来,生成式人工智能在文本、图像甚至视频领域取得了重大突破。然而,音频,尤其是音乐,似乎一直滞后。 Suno最新的V3版本似乎正在解开AI音乐的秘密。 “我希望看到音乐制作的民主化,让每个人都可以制作自己的专业级歌曲。”

“我们喜欢编写代码、创作音乐和喝咖啡。我们的企业文化围绕着音乐和声音实验,从午餐时的聊天到办公室的录音室。” Suno的官方网站上,团队介绍如下。

据《滚石》(《滚石》杂志)3月17日报道,Suno成立不到两年,目前拥有12名员工。该公司的临时办公室距离剑桥大学仅几步之遥。

四位联合创始人Mikey Shulman、Keenan Freyberg、Georg Kucsko 和Martin Camacho 都是机器学习领域的专家,此前曾在人工智能公司Kensho 共事。

其中,拥有哈佛大学物理学博士学位的米奇·舒尔曼和毕业于哈佛大学计算机科学和数学专业的卡马乔也是音乐家,经常在工作之余一起进行即兴表演。

麦基·舒尔曼和马丁·卡马乔

Georg Kucsko 还拥有哈佛大学物理学博士学位,而Keenan Freyberg 则拥有乔治华盛顿大学学士学位。

格奥尔格·库斯科和基南·弗雷伯格

Kensho是一家成立于2013年的公司,专注于为大型金融机构提供人工智能分析。在那里,四人共同开发了一种转录技术,用于记录上市公司的财报电话会议。这是一项棘手的任务,因为电话会议的音频质量很差,行话较多,并且混有各种口音。

Suno采取的方法类似于ChatGPT等大型语言模型的常见方法,即将人类语言分解为称为标记的离散段落,吸收其数百万种用法、风格和结构,并根据需要重建它们。但音频,尤其是音乐,更为复杂。为此,有专家一度认为,音频领域可能还需要很多年才能出现重大突破。

《滚石》 该杂志还提到,Suno 的创始人拒绝透露输入模型的数据细节,只是V3 可以部分通过学习语音录音和音乐来生成令人信服的人类声音。

事实上,Suno也预见到了接下来可能面临的问题,比如来自音乐厂牌和发行商的版权诉讼。创始人表示,他们充分尊重艺术家和知识产权,并正在与各大音乐厂牌进行沟通。 “它不会让你在提示中请求任何特定艺术家的风格,也不会使用真正的艺术家的声音。”

“我们的想法是努力让十亿人比现在更加热爱音乐,”舒尔曼说。 “如果人们更加热爱音乐,更加专注于创作,培养出更加独特的品味,这对艺术家来说无疑是有利的。我们对音乐的未来非常乐观。我们的愿景是一个对艺术家友好的世界。我们不是试图取代艺术家。”目前,V4版本正在开发中,预计很快就会推出。

主编:童伟审稿人:陈毅梁英杰

热门文章