文|雷科技
自从chatgpt面世以来,生成式ai已经给我们带来了诸多惊喜,并且ai对于不同行业的影响力还在不断扩散。2024年才刚过去3个月,就已经涌现出一批新的ai大模型:文字生成视频的sora、支持200万字长文本处理的kimi,以及文生音频的新星——suno。
「音乐界的chatgpt」、「可能席卷全世界的可怕ai音乐」、「颠覆音乐圈」,这些是无数网友和媒体在体验过suno后给出的真实评价。
suno是ai初创公司suno推出的音乐生成模型,无论用户是否拥有乐理知识,只需输入简单的提示词,比如音乐风格、音乐流派、歌词内容、音色等,等待几秒就能快速生成带有歌词和节拍的2分钟音乐。
值得注意的是,近期suno公司还推出了v3版本,该版本首次能够生成广播质量的音乐,并新增了更丰富的音乐风格和流派选项,比如古典音乐、爵士乐、hiphop、电子等新潮曲风。官方表示v4版本已经在开发中,并计划推出全新功能。
suno初体验:一键成歌,效果惊艳
看到这里,雷科技抱着好奇打开了suno官网。我们首先看到的是许多首由suno生成的音乐,以英文歌曲为主。随机试听了几首之后,感觉旋律还挺上头,这让我对suno的表现有了更高的期待。
注册好账号,我们打开创造页面。整体界面和chatgpt类似,拥有关键词输入框、音乐流派、模型选择等选项。
话不多说,下面正式开始「音乐小白」的创作之路。为了体现suno的实力,雷科技特意用中文输入了自己都无法理解的关键词:「用民谣描述关于金刚与哥斯拉的爱情故事」。
等待数秒后,雷科技第一首歌曲「金刚与哥斯拉的爱情故事」制作完成。从歌词来看,suno精准识别到了金刚和哥斯拉两个关键词,并在它们怪物身份上延伸出了战斗等场景描述。
点击播放歌曲,结果让我感到震惊,完全不相信这是由我给与的关键词创作而成的歌曲。至少听起来没有ai生成常有的生涩感,歌词押韵,甚至还附带有和声、分段。作为「音乐小白」,雷科技感觉这首歌曲是符合要求的。
随后雷科技连续生成了几首不同流派、不同主题的歌曲,新鲜感过去后,雷科技发觉suno生成相同曲风的歌曲有种千篇一律的感觉,虽然歌词和旋律不一样,但个人感觉与抖音上常听的口水歌非常相似。
在查阅资料的过程中,雷科技发现suno原来还有进阶玩法。在创造界面的自定义模式下,用户可以自行制定intro(引子或前奏)、verse(诗歌部分 / 主歌)、chorus(合唱部分 / 副歌)、bridge(桥接部分)、outro(尾奏)等部分的歌词,并通过关键词技巧,让ai理解用户表达。
因为涉及到实际乐理知识,不懂音乐的朋友理解起来相当麻烦,雷科技将其总结为:「风格+情感+乐器+节奏+人声」。如果你觉得自己想歌词太麻烦,但又对歌词感兴趣,可以结合chatgpt,让ai生成符合你要求的歌词文本。
如果你想参考现有歌曲的节奏,则需将歌曲的bpm(节奏)和key(调高)输入到关键词中。
一番体验下来,雷科技认为suno表现十分惊人。无论是面向小白的一键生成,还是专业向的自定义生成,都能在极短时间内生成出颇具质量的歌曲。尤其是自定义生成,探索页面的优秀作品向我们展示了suno的无限可能。至少从目前看来,还没有人能断言suno v3版本的上限,每日不断涌现的最新作品就是最好的证明。
图源:suno
ai音乐强大,但“人类音乐”永远无可替代
可能有很多人会感到好奇,究竟是一家什么样的公司才能创造出如此神奇的suno v3。目前,suno团队成立仅两年,团队成员只有12个人,部分团队成员此前服务于meta、tiktok和kensho technologies等科技公司。
其实在suno出现之前,市面上已经出现了数款ai音乐生成工具,dream track、jammable以及project music genai就是其中的代表。suno之所以能在互联网上形成病毒式传播,主要原因是其简化了普通人创造歌曲的步骤,用户只需简单引导就能自动完成人声、歌词、风格、曲谱等内容。
这令普通人与专业音乐创作者之间的差距瞬间缩小,就像midjourney生成图像引起设计行业动荡那样,suno同样引起了部分音乐人的警觉。虽然现阶段suno的创作水平还远远没有达到足以颠覆音乐圈的阶段,但ai最可怕的是学习能力。suno团队在2023年7月才在生成模型中加入了人声音乐功能,仅仅过去9个月时间,就已经迭代至v3版本,或许没有人能预测出suno的最终水平。
在雷科技看来,suno确实可以让普通人大批量创造「原创」歌曲,但颠覆音乐圈的可能性不高。
首先,歌曲的本质是人们的自我表达,和文字、图片是一个道理,只不过歌曲的表现形式更为复杂,光是声音层次就能形成若干种可能。
ai固然可以通过高强度的学习,还原出各种声音与曲风,甚至未来还能形成连贯性的长音乐。
但一首好的歌曲之所以能与听众形成共鸣,是因为它与人、社会有着充分联系,这也是为什么我们在听部分歌曲时会激动、会难过的原因。而ai音乐暂时还没有表现出对应的能力,鉴于当前情况,我更愿意称之为「无情的创作机器」。
图源:suno
其次,还是老生常谈的版权问题。suno团队至今未公布suno模型是用什么数据训练而成,如果他们在未经允许的情况下,使用了有版权保护的作品,那么他们将面临起诉,而用户借助suno生成的音乐作品也有着同样的风险。
许多用户除了生成全新歌曲外,还会对现有歌曲进行二创,这部分操作是否合法,至今仍未有定论。ai生成内容给现有法律体系带来了不少难题,ai网文、ai图像,ai音乐、ai复活等技术的诞生给知识产权带来了新的复杂性,如何避免法律风险,合法且道德引导用户使用suno制作音乐,是阻碍suno发展的首要难题。
实际上,suno团队也意识到了ai音乐和音乐圈之间的复杂关系,他们表示团队正致力于让人们深入接触音乐创作,而非替代音乐家。
最后,suno真正颠覆的应该是专门打造网络神曲的制作公司,一直以来,公式化创作歌曲是这批公司的强项,但suno显然比他们更具优势。在suno的冲击下,这个行业又将迎来新一轮洗牌。
suno是偶然,aigc重构内容产业是必然
大模型进入人们视线范围的时间其实并不长,但它给人们生活带来了切切实实的改变。更高的效率和更低的门槛,两者是大模型的最大魅力。在「ai+x」的场景中,过去行业的限入门槛没了,人人都可以是创作者,每个人都能尽情表达自我。
suno像chatgpt、sora、kimi等诸多前辈一样,成功引起了对应行业的震撼。虽说还无法达到人类输出实际情感的要求,但其歌曲生成效率已经成功打败了99%的音乐人,并且这个优势还会不断扩大。
雷科技实际体验suno的时间并不长,但在攻略的帮助下已能创作出一些看似有点专业性的歌曲。「音乐小白」尚且如此,专业音乐创作者使用suno的效率必然更高,得到的惊喜自然也会更多。
当ai音乐泛滥,用户如何在歌曲海洋中找到符合自己审美的音乐,或许又会成为新的难题。大模型与音乐内容结合的新一代ai音乐推荐,也将迎来新的机会。
suno以及其代表的aigc平台,正在重构内容产业秩序。
雷科技想起了抖音以及tiktok。从名字可以看出,抖音十分注重“音乐”在短视频内容中的价值,tiktok的前身业务很大一部分源自于字节收购的musical.ly。毫不夸张地说,抖音以及tiktok均是从“音乐”出发去建构了短视频帝国,这正是快手等短视频平台不具备的特质。如今,抖音在事实上也已成为网红音乐制造机。
因此,suno的出现,以及aigc的爆发,最直接冲击的应该是抖音等短视频内容平台,因为内容的生产逻辑正在发生剧变。或许正是因为此,一手将抖音做大的抖音集团前ceo会辞任转而主攻剪映。字节在aigc上的储备与实力跟其体量无法匹配,也无法跟微软、google、meta、百度、阿里等巨头比肩。好在字节正在加码aigc,因为ai是字节的基因,aigc是字节最不能输的战争——至于游戏、教育、飞书等业务,都不属于核心。
aigc的浪潮正以超出所有人预期的速度,奔涌而来。