Suno奇襲音樂圈,AI能製造萬能青年旅店嗎?

文|吳懟懟,作者|夏天

時光游戲裏總是充滿了很多奇妙的「巧合」。

1787年,莫扎特發明了一個音樂骰子遊戲。遊戲道具是176條小步舞曲小節,96條三重奏小節,兩張寫滿數字的規則表,兩顆骰子。遊戲規則是將兩顆骰子隨機投擲16次,根據投擲數字,選擇規則表中對應的音樂片段,組成一支隨機的小步舞曲。

將樂曲的最終排列方式交給某種規則,莫扎特此舉或許只是出於好奇和娛樂,而這場娛樂和好奇無意中觸及的「機器選擇」卻將在237年後帶領音樂走向截然不同的新國度。

現在,suno拿到了開啟大門的鑰匙。

ai改造音樂,從2.0到3.0

ai改造音樂,似乎是這兩年才火起來的風口。但它的技術沉澱,已經有一段時間了。

1957年,lejaren hiller和leonard issacson兩位教授認為,音樂作品的美,是因為它們符合某種規則,而計算機如果能學會這種規則,那麼它也能創作出優美的音樂。

抱着這樣的想法,他們用諸如「範圍不能超過一個八度、必須從c音開始和結束」之類的程序設置,創作了弦樂四重奏《伊利亞克組曲》,完成了人類歷史上第一首完全由計算機「作曲」的音樂作品。

無論你是否同意這組計算機創作的音樂具有藝術性,但它至少可以算是完整的習作。「音樂是情感還是規則的表達?計算機生成的音樂能稱之為音樂嗎?……」等圍繞人工智能與音樂之間的討論紛至沓來,人們預見了人工智能可能帶來的威脅,但極力否認這種威脅的存在。

這之後,ai音樂迅速發展。

1986年,ai作曲教父的大衛·柯普創作出音樂軟件emi。1997年,一位講授在斯坦福大學的講座上向聽眾彈了三首鋼琴曲,一首巴赫的作品,一首是emi模仿巴赫風格創作的作品,一首教授丈夫的作品,讓觀眾們猜一下這三首曲子分別是誰的。人們大都把教授丈夫的作品當做計算機作品,而把emi的作品當做巴赫的作品。

當然,這或許是因為教授丈夫的作曲技術還不夠嫻熟,又或者是普通聽眾對音樂的敏銳度不高。

2016年,一位法國計算機科學家看了科幻電影《她》(her)後決定創作一個音樂人工智能模型,aiva便誕生了。通過對莫扎特、巴赫、貝多芬等名家的15000首曲子進行深度學習, aiva開始創建自己的音樂作品。

當團隊將 aiva的作品與作曲家的作品混在一起時,受邀請的音樂家幾乎聽辨不出它們的區別。後來,aiva成為「法國及盧森堡作曲家協會」(sacem)的首個非人類會員,並擁有自己的作品署名權。

之前,人們還在爭論機器創作的音樂能不能稱為音樂。現在,人們嘗試與它和平共處,並考慮用它賺錢了。

aiva主要面向遊戲、廣告、電影等對古典音樂需求量大的行業,它曾經參與到盧森堡國慶日開幕式、英偉達gtc 2020大會等重要活動的背景音樂創作。

同時aiva也向個人提供定製化的歌曲服務,比如輔助流行歌手taryn southern完成《love sick》的創作。

與aiva類似,後續ai音樂模型的商業化主要也是圍繞視頻配樂和輔助歌手創作這兩個方向進行。

此時ai已經能夠創作出完整的音樂,但完全交由它創作的音樂卻過於模式化,要讓音樂富有藝術性還是需要人類進行篩選調教。ai更多是作為輔助人類進行藝術創作的工具而存在。

人們驚嘆於ai在音樂處理上的規整,慶幸於它在「理解」音樂藝術性上的遲鈍。‍

音樂行業的chatgpt時刻

當suno出現,一切又不一樣了。

近日,ai音樂生成軟件suno發佈v3版本,僅需要簡單的描述,就可以生成時長2分鐘左右、包含歌詞、前奏、間奏、副歌在內,廣播質量級別的音樂。

此外,suno還支持鼓、鋼琴、小提琴、大提琴四種樂器;放鬆、迷幻、氛圍感等29種音樂風格;民謠、放克、重金屬等71種音樂流派的音樂生成,範圍基本覆蓋了主流的音樂審美。

suno的強項是音頻生產,文本方面可以調用chatgpt生成歌詞和標題。在suno官網的ai音樂排行榜上,多首歌曲播放量已過萬。我們也嘗試suno進行了音樂創作。

能否拿獎不好說,替代流行的網絡神曲是綽綽有餘了。如果我們認同口水歌具有廣義的藝術性,那麼我們就得承認ai能夠「復刻」藝術。

與suno類似的還有網易雲音樂在2022年4月上線的 ai 音樂創作平台網易天音。網易天音分為ai寫歌和ai編曲兩個模式,ai寫歌似於suno的普通模式面向沒有樂理知識的純小白類,ai編曲類似於suno的自定義模式則面向具備一定音樂基礎的創作者。

小白模式下,兩者的操作方式都非常簡單,網易天音甚至能提供人聲、伴奏選擇等更為個性化的服務,但從生成結果來看,suno生成的音樂人工痕迹更弱。

去年三月,人們已經通過chatgpt預見了人工智能對音樂行業的改造潛力。但彼時各方對ai的研究還停留在通用大模型,音樂行業的眾人樂觀的估計,ai對音樂的行業改造還得等幾年。然後僅僅過去了一年,倒計時便開始了。

顯然,比起ai音樂本身,更讓人擔心的是ai音樂的發展速度。

目前的suno經過幾個小時調教後就能夠生成較為優質的口水歌,將這些歌與神曲製作公司花費幾天製作的口水歌一起投放到短視頻平台,很難說它們誰會更火。

suno商用版每月的套餐只需24美元(年付),摺合人民幣不到200元,而一名員工每月的工資支出以千起步,音樂公司依舊需要人對ai生產的音樂進行調教,但不需要那麼多的人做同一工作。

被踢出局的人要麼轉行,要麼從事對藝術性要求更高的音樂創作。

與chatgpt一樣,suno也擺脫不了數據掣肘,但它面臨的數據壓力,要比chatgpt大得多。

音樂的元數據比圖像和文本更為複雜,音樂製作過程中保留的包含大部分創作細節的midi數據歸屬於版權方,科技公司無法從互聯網得到,而缺乏原始數據,訓練效果會大打折扣。

有數據有資金的三大唱片,一邊罵著短視頻平台和音樂平台鼓勵ai音樂發展,侵犯了音樂人權益,一邊加緊對ai音樂的研究和投資。背靠索尼的索尼音樂成立了sonyai,華納收購 asodatone、投資lifescore,環球投資了soundful。

當aiva的創始人被問及為什麼選擇專註於古典音樂時,他表示用來訓練aiva的古典音樂數據庫不涉及版權問題,版權都過期了。現在看來,他頗有先見之明。

音樂人,能否從藝術向音樂中找到出路?

三大唱片對唱片數據的掌控會延緩平台及科技公司ai音樂模型的發展,為音樂人爭取到更多的時間;但數據的缺少也可能倒逼平台及科技公司對自身的模型不斷優化,使得奇點時刻提前到來,加快音樂人的失業。

無論怎樣,這場場巨大的失業危機都無法避免。所幸,ai的主戰場在視頻配樂、廣告音樂等功能向音樂,在藝術向音樂,音樂人還能得到一絲喘息的機會。

普通的廣告配樂、短視頻配樂交由ai完成即可,而專業的電影遊戲配樂或許交由專業人士更為妥當,一是這類客戶對音樂的藝術性要求更高,合格水平的配樂並不能滿足其需求,他們需要的是創造驚喜。

二是在客戶對於某小節音樂中配器種類,音符時值等細節性的要求上,直接交由人類修改更為便捷。

電影《西蒙妮》中,一個虛擬程序經過精心的營銷包裝,成為了萬眾追捧的影視新星。雖然這可能有經紀人隱瞞西蒙妮是虛擬程序的功勞。但在ai音樂時代,人們即使知道西蒙妮的真實身份,也未必不會愛它。

同樣的,誰知道音樂界會不會誕生自己的西蒙妮呢,畢竟虛擬歌姬初音未來的演唱會號召力可是不輸真人。虛擬現實技術不斷發展,vr眼鏡價格下降是早晚的事,賽博音樂節或許成為新的時尚。

很多聽眾被ai創作的音樂折服時,往往會加上一句「ai音樂始終少了點情感」。人們聽音樂雖然是聽音樂本身,但音樂背後的故事能給予聽眾更多的情感遐想空間。只要蛋好吃又何必在乎下蛋的雞?

在ai音樂的時代,雞蛋和下蛋的雞將變得同樣重要。音樂作品之外,加大音樂人的個人曝光以及營銷,增添音樂之外的故事(這些故事通常本身就存在,只是沒有被發掘)。

千萬不要有道德負罪感,認為自己在利用音樂「夾帶私貨」,在大眾對「ai究竟是創作還是模仿藝術」尚無定論的時代,通過「夾帶私貨」為人類創作的音樂招攬更多的聽眾並不是什麼十惡不赦的事。

當然,你也可以繼續做一位音樂原教旨主義者,只談音樂,不論其它。在人人為ai所動的年代,你的堅持和存在,本身就是一種力量。

比起這些,我們更擔心的或許是人類失去文化領域的主導權。

現在,ai已經能夠模擬出音樂作品中低層次的審美情感表達,假以時日,ai或許能夠模擬出音樂作品中更為深層次複雜的審美情感表達,創作出媲美莫扎特音樂作品的莫扎特1號、莫扎特2號……

雖然從「人的本質力量對象化」的角度講,這些莫扎特1號、莫扎特2號永遠不能被稱為藝術品,但它們足夠和莫扎特的作品一起,滿足人類的審美需要了。

今天,音樂人是被涅槃、被竇唯、被萬青所打動,沿着他們的精神方向進行音樂創作。

明天,音樂人被ai創作的涅槃1號、竇唯1號、萬青1號打動,沿着ai音樂人理解的人類精神信仰進行創作。

n年後,莫扎特1000000號消失了,取而代之的是人工智能1號。