Suno奇袭音乐圈,AI能制造万能青年旅店吗?

文|吴怼怼,作者|夏天

时光游戏里总是充满了很多奇妙的“巧合”。

1787年,莫扎特发明了一个音乐骰子游戏。游戏道具是176条小步舞曲小节,96条三重奏小节,两张写满数字的规则表,两颗骰子。游戏规则是将两颗骰子随机投掷16次,根据投掷数字,选择规则表中对应的音乐片段,组成一支随机的小步舞曲。

将乐曲的最终排列方式交给某种规则,莫扎特此举或许只是出于好奇和娱乐,而这场娱乐和好奇无意中触及的“机器选择”却将在237年后带领音乐走向截然不同的新国度。

现在,suno拿到了开启大门的钥匙。

ai改造音乐,从2.0到3.0

ai改造音乐,似乎是这两年才火起来的风口。但它的技术沉淀,已经有一段时间了。

1957年,lejaren hiller和leonard issacson两位教授认为,音乐作品的美,是因为它们符合某种规则,而计算机如果能学会这种规则,那么它也能创作出优美的音乐。

抱着这样的想法,他们用诸如“范围不能超过一个八度、必须从c音开始和结束”之类的程序设置,创作了弦乐四重奏《伊利亚克组曲》,完成了人类历史上第一首完全由计算机“作曲”的音乐作品。

无论你是否同意这组计算机创作的音乐具有艺术性,但它至少可以算是完整的习作。“音乐是情感还是规则的表达?计算机生成的音乐能称之为音乐吗?……”等围绕人工智能与音乐之间的讨论纷至沓来,人们预见了人工智能可能带来的威胁,但极力否认这种威胁的存在。

这之后,ai音乐迅速发展。

1986年,ai作曲教父的大卫·柯普创作出音乐软件emi。1997年,一位讲授在斯坦福大学的讲座上向听众弹了三首钢琴曲,一首巴赫的作品,一首是emi模仿巴赫风格创作的作品,一首教授丈夫的作品,让观众们猜一下这三首曲子分别是谁的。人们大都把教授丈夫的作品当做计算机作品,而把emi的作品当做巴赫的作品。

当然,这或许是因为教授丈夫的作曲技术还不够娴熟,又或者是普通听众对音乐的敏锐度不高。

2016年,一位法国计算机科学家看了科幻电影《她》(her)后决定创作一个音乐人工智能模型,aiva便诞生了。通过对莫扎特、巴赫、贝多芬等名家的15000首曲子进行深度学习, aiva开始创建自己的音乐作品。

当团队将 aiva的作品与作曲家的作品混在一起时,受邀请的音乐家几乎听辨不出它们的区别。后来,aiva成为“法国及卢森堡作曲家协会”(sacem)的首个非人类会员,并拥有自己的作品署名权。

之前,人们还在争论机器创作的音乐能不能称为音乐。现在,人们尝试与它和平共处,并考虑用它赚钱了。

aiva主要面向游戏、广告、电影等对古典音乐需求量大的行业,它曾经参与到卢森堡国庆日开幕式、英伟达gtc 2020大会等重要活动的背景音乐创作。

同时aiva也向个人提供定制化的歌曲服务,比如辅助流行歌手taryn southern完成《love sick》的创作。

与aiva类似,后续ai音乐模型的商业化主要也是围绕视频配乐和辅助歌手创作这两个方向进行。

此时ai已经能够创作出完整的音乐,但完全交由它创作的音乐却过于模式化,要让音乐富有艺术性还是需要人类进行筛选调教。ai更多是作为辅助人类进行艺术创作的工具而存在。

人们惊叹于ai在音乐处理上的规整,庆幸于它在“理解”音乐艺术性上的迟钝。‍

音乐行业的chatgpt时刻

当suno出现,一切又不一样了。

近日,ai音乐生成软件suno发布v3版本,仅需要简单的描述,就可以生成时长2分钟左右、包含歌词、前奏、间奏、副歌在内,广播质量级别的音乐。

此外,suno还支持鼓、钢琴、小提琴、大提琴四种乐器;放松、迷幻、氛围感等29种音乐风格;民谣、放克、重金属等71种音乐流派的音乐生成,范围基本覆盖了主流的音乐审美。

suno的强项是音频生产,文本方面可以调用chatgpt生成歌词和标题。在suno官网的ai音乐排行榜上,多首歌曲播放量已过万。我们也尝试suno进行了音乐创作。

能否拿奖不好说,替代流行的网络神曲是绰绰有余了。如果我们认同口水歌具有广义的艺术性,那么我们就得承认ai能够“复刻”艺术。

与suno类似的还有网易云音乐在2022年4月上线的 ai 音乐创作平台网易天音。网易天音分为ai写歌和ai编曲两个模式,ai写歌似于suno的普通模式面向没有乐理知识的纯小白类,ai编曲类似于suno的自定义模式则面向具备一定音乐基础的创作者。

小白模式下,两者的操作方式都非常简单,网易天音甚至能提供人声、伴奏选择等更为个性化的服务,但从生成结果来看,suno生成的音乐人工痕迹更弱。

去年三月,人们已经通过chatgpt预见了人工智能对音乐行业的改造潜力。但彼时各方对ai的研究还停留在通用大模型,音乐行业的众人乐观的估计,ai对音乐的行业改造还得等几年。然后仅仅过去了一年,倒计时便开始了。

显然,比起ai音乐本身,更让人担心的是ai音乐的发展速度。

目前的suno经过几个小时调教后就能够生成较为优质的口水歌,将这些歌与神曲制作公司花费几天制作的口水歌一起投放到短视频平台,很难说它们谁会更火。

suno商用版每月的套餐只需24美元(年付),折合人民币不到200元,而一名员工每月的工资支出以千起步,音乐公司依旧需要人对ai生产的音乐进行调教,但不需要那么多的人做同一工作。

被踢出局的人要么转行,要么从事对艺术性要求更高的音乐创作。

与chatgpt一样,suno也摆脱不了数据掣肘,但它面临的数据压力,要比chatgpt大得多。

音乐的元数据比图像和文本更为复杂,音乐制作过程中保留的包含大部分创作细节的midi数据归属于版权方,科技公司无法从互联网得到,而缺乏原始数据,训练效果会大打折扣。

有数据有资金的三大唱片,一边骂着短视频平台和音乐平台鼓励ai音乐发展,侵犯了音乐人权益,一边加紧对ai音乐的研究和投资。背靠索尼的索尼音乐成立了sonyai,华纳收购 asodatone、投资lifescore,环球投资了soundful。

当aiva的创始人被问及为什么选择专注于古典音乐时,他表示用来训练aiva的古典音乐数据库不涉及版权问题,版权都过期了。现在看来,他颇有先见之明。

音乐人,能否从艺术向音乐中找到出路?

三大唱片对唱片数据的掌控会延缓平台及科技公司ai音乐模型的发展,为音乐人争取到更多的时间;但数据的缺少也可能倒逼平台及科技公司对自身的模型不断优化,使得奇点时刻提前到来,加快音乐人的失业。

无论怎样,这场场巨大的失业危机都无法避免。所幸,ai的主战场在视频配乐、广告音乐等功能向音乐,在艺术向音乐,音乐人还能得到一丝喘息的机会。

普通的广告配乐、短视频配乐交由ai完成即可,而专业的电影游戏配乐或许交由专业人士更为妥当,一是这类客户对音乐的艺术性要求更高,合格水平的配乐并不能满足其需求,他们需要的是创造惊喜。

二是在客户对于某小节音乐中配器种类,音符时值等细节性的要求上,直接交由人类修改更为便捷。

电影《西蒙妮》中,一个虚拟程序经过精心的营销包装,成为了万众追捧的影视新星。虽然这可能有经纪人隐瞒西蒙妮是虚拟程序的功劳。但在ai音乐时代,人们即使知道西蒙妮的真实身份,也未必不会爱它。

同样的,谁知道音乐界会不会诞生自己的西蒙妮呢,毕竟虚拟歌姬初音未来的演唱会号召力可是不输真人。虚拟现实技术不断发展,vr眼镜价格下降是早晚的事,赛博音乐节或许成为新的时尚。

很多听众被ai创作的音乐折服时,往往会加上一句“ai音乐始终少了点情感”。人们听音乐虽然是听音乐本身,但音乐背后的故事能给予听众更多的情感遐想空间。只要蛋好吃又何必在乎下蛋的鸡?

在ai音乐的时代,鸡蛋和下蛋的鸡将变得同样重要。音乐作品之外,加大音乐人的个人曝光以及营销,增添音乐之外的故事(这些故事通常本身就存在,只是没有被发掘)。

千万不要有道德负罪感,认为自己在利用音乐“夹带私货”,在大众对“ai究竟是创作还是模仿艺术”尚无定论的时代,通过“夹带私货”为人类创作的音乐招揽更多的听众并不是什么十恶不赦的事。

当然,你也可以继续做一位音乐原教旨主义者,只谈音乐,不论其它。在人人为ai所动的年代,你的坚持和存在,本身就是一种力量。

比起这些,我们更担心的或许是人类失去文化领域的主导权。

现在,ai已经能够模拟出音乐作品中低层次的审美情感表达,假以时日,ai或许能够模拟出音乐作品中更为深层次复杂的审美情感表达,创作出媲美莫扎特音乐作品的莫扎特1号、莫扎特2号……

虽然从“人的本质力量对象化”的角度讲,这些莫扎特1号、莫扎特2号永远不能被称为艺术品,但它们足够和莫扎特的作品一起,满足人类的审美需要了。

今天,音乐人是被涅槃、被窦唯、被万青所打动,沿着他们的精神方向进行音乐创作。

明天,音乐人被ai创作的涅槃1号、窦唯1号、万青1号打动,沿着ai音乐人理解的人类精神信仰进行创作。

n年后,莫扎特1000000号消失了,取而代之的是人工智能1号。