文|雷科技
自從chatgpt面世以來,生成式ai已經給我們帶來了諸多驚喜,並且ai對於不同行業的影響力還在不斷擴散。2024年才剛過去3個月,就已經湧現出一批新的ai大模型:文字生成視頻的sora、支持200萬字長文本處理的kimi,以及文生音頻的新星——suno。
「音樂界的chatgpt」、「可能席捲全世界的可怕ai音樂」、「顛覆音樂圈」,這些是無數網友和媒體在體驗過suno後給出的真實評價。
suno是ai初創公司suno推出的音樂生成模型,無論用戶是否擁有樂理知識,只需輸入簡單的提示詞,比如音樂風格、音樂流派、歌詞內容、音色等,等待幾秒就能快速生成帶有歌詞和節拍的2分鐘音樂。
值得注意的是,近期suno公司還推出了v3版本,該版本首次能夠生成廣播質量的音樂,並新增了更豐富的音樂風格和流派選項,比如古典音樂、爵士樂、hiphop、電子等新潮曲風。官方表示v4版本已經在開發中,並計劃推出全新功能。
suno初體驗:一鍵成歌,效果驚艷
看到這裡,雷科技抱着好奇打開了suno官網。我們首先看到的是許多首由suno生成的音樂,以英文歌曲為主。隨機試聽了幾首之後,感覺旋律還挺上頭,這讓我對suno的表現有了更高的期待。
註冊好賬號,我們打開創造頁面。整體界面和chatgpt類似,擁有關鍵詞輸入框、音樂流派、模型選擇等選項。
話不多說,下面正式開始「音樂小白」的創作之路。為了體現suno的實力,雷科技特意用中文輸入了自己都無法理解的關鍵詞:「用民謠描述關於金剛與哥斯拉的愛情故事」。
等待數秒後,雷科技第一首歌曲「金剛與哥斯拉的愛情故事」製作完成。從歌詞來看,suno精準識別到了金剛和哥斯拉兩個關鍵詞,並在它們怪物身份上延伸出了戰鬥等場景描述。
點擊播放歌曲,結果讓我感到震驚,完全不相信這是由我給與的關鍵詞創作而成的歌曲。至少聽起來沒有ai生成常有的生澀感,歌詞押韻,甚至還附帶有和聲、分段。作為「音樂小白」,雷科技感覺這首歌曲是符合要求的。
隨後雷科技連續生成了幾首不同流派、不同主題的歌曲,新鮮感過去後,雷科技發覺suno生成相同曲風的歌曲有種千篇一律的感覺,雖然歌詞和旋律不一樣,但個人感覺與抖音上常聽的口水歌非常相似。
在查閱資料的過程中,雷科技發現suno原來還有進階玩法。在創造界面的自定義模式下,用戶可以自行制定intro(引子或前奏)、verse(詩歌部分 / 主歌)、chorus(合唱部分 / 副歌)、bridge(橋接部分)、outro(尾奏)等部分的歌詞,並通過關鍵詞技巧,讓ai理解用戶表達。
因為涉及到實際樂理知識,不懂音樂的朋友理解起來相當麻煩,雷科技將其總結為:「風格+情感+樂器+節奏+人聲」。如果你覺得自己想歌詞太麻煩,但又對歌詞感興趣,可以結合chatgpt,讓ai生成符合你要求的歌詞文本。
如果你想參考現有歌曲的節奏,則需將歌曲的bpm(節奏)和key(調高)輸入到關鍵詞中。
一番體驗下來,雷科技認為suno表現十分驚人。無論是面向小白的一鍵生成,還是專業向的自定義生成,都能在極短時間內生成出頗具質量的歌曲。尤其是自定義生成,探索頁面的優秀作品向我們展示了suno的無限可能。至少從目前看來,還沒有人能斷言suno v3版本的上限,每日不斷湧現的最新作品就是最好的證明。
圖源:suno
ai音樂強大,但「人類音樂」永遠無可替代
可能有很多人會感到好奇,究竟是一家什麼樣的公司才能創造出如此神奇的suno v3。目前,suno團隊成立僅兩年,團隊成員只有12個人,部分團隊成員此前服務於meta、tiktok和kensho technologies等科技公司。
其實在suno出現之前,市面上已經出現了數款ai音樂生成工具,dream track、jammable以及project music genai就是其中的代表。suno之所以能在互聯網上形成病毒式傳播,主要原因是其簡化了普通人創造歌曲的步驟,用戶只需簡單引導就能自動完成人聲、歌詞、風格、曲譜等內容。
這令普通人與專業音樂創作者之間的差距瞬間縮小,就像midjourney生成圖像引起設計行業動蕩那樣,suno同樣引起了部分音樂人的警覺。雖然現階段suno的創作水平還遠遠沒有達到足以顛覆音樂圈的階段,但ai最可怕的是學習能力。suno團隊在2023年7月才在生成模型中加入了人聲音樂功能,僅僅過去9個月時間,就已經迭代至v3版本,或許沒有人能預測出suno的最終水平。
在雷科技看來,suno確實可以讓普通人大批量創造「原創」歌曲,但顛覆音樂圈的可能性不高。
首先,歌曲的本質是人們的自我表達,和文字、圖片是一個道理,只不過歌曲的表現形式更為複雜,光是聲音層次就能形成若干種可能。
ai固然可以通過高強度的學習,還原出各種聲音與曲風,甚至未來還能形成連貫性的長音樂。
但一首好的歌曲之所以能與聽眾形成共鳴,是因為它與人、社會有着充分聯繫,這也是為什麼我們在聽部分歌曲時會激動、會難過的原因。而ai音樂暫時還沒有表現出對應的能力,鑒於當前情況,我更願意稱之為「無情的創作機器」。
圖源:suno
其次,還是老生常談的版權問題。suno團隊至今未公布suno模型是用什麼數據訓練而成,如果他們在未經允許的情況下,使用了有版權保護的作品,那麼他們將面臨起訴,而用戶藉助suno生成的音樂作品也有着同樣的風險。
許多用戶除了生成全新歌曲外,還會對現有歌曲進行二創,這部分操作是否合法,至今仍未有定論。ai生成內容給現有法律體系帶來了不少難題,ai網文、ai圖像,ai音樂、ai復活等技術的誕生給知識產權帶來了新的複雜性,如何避免法律風險,合法且道德引導用戶使用suno製作音樂,是阻礙suno發展的首要難題。
實際上,suno團隊也意識到了ai音樂和音樂圈之間的複雜關係,他們表示團隊正致力於讓人們深入接觸音樂創作,而非替代音樂家。
最後,suno真正顛覆的應該是專門打造網絡神曲的製作公司,一直以來,公式化創作歌曲是這批公司的強項,但suno顯然比他們更具優勢。在suno的衝擊下,這個行業又將迎來新一輪洗牌。
suno是偶然,aigc重構內容產業是必然
大模型進入人們視線範圍的時間其實並不長,但它給人們生活帶來了切切實實的改變。更高的效率和更低的門檻,兩者是大模型的最大魅力。在「ai+x」的場景中,過去行業的限入門檻沒了,人人都可以是創作者,每個人都能盡情表達自我。
suno像chatgpt、sora、kimi等諸多前輩一樣,成功引起了對應行業的震撼。雖說還無法達到人類輸出實際情感的要求,但其歌麴生成效率已經成功打敗了99%的音樂人,並且這個優勢還會不斷擴大。
雷科技實際體驗suno的時間並不長,但在攻略的幫助下已能創作出一些看似有點專業性的歌曲。「音樂小白」尚且如此,專業音樂創作者使用suno的效率必然更高,得到的驚喜自然也會更多。
當ai音樂泛濫,用戶如何在歌曲海洋中找到符合自己審美的音樂,或許又會成為新的難題。大模型與音樂內容結合的新一代ai音樂推薦,也將迎來新的機會。
suno以及其代表的aigc平台,正在重構內容產業秩序。
雷科技想起了抖音以及tiktok。從名字可以看出,抖音十分注重「音樂」在短視頻內容中的價值,tiktok的前身業務很大一部分源自於位元組收購的musical.ly。毫不誇張地說,抖音以及tiktok均是從「音樂」出發去建構了短視頻帝國,這正是快手等短視頻平台不具備的特質。如今,抖音在事實上也已成為網紅音樂製造機。
因此,suno的出現,以及aigc的爆發,最直接衝擊的應該是抖音等短視頻內容平台,因為內容的生產邏輯正在發生劇變。或許正是因為此,一手將抖音做大的抖音集團前ceo會辭任轉而主攻剪映。位元組在aigc上的儲備與實力跟其體量無法匹配,也無法跟微軟、google、meta、百度、阿里等巨頭比肩。好在位元組正在加碼aigc,因為ai是位元組的基因,aigc是位元組最不能輸的戰爭——至於遊戲、教育、飛書等業務,都不屬於核心。
aigc的浪潮正以超出所有人預期的速度,奔涌而來。