AI音樂概念爆發,中國音樂GPT時刻來了嗎?

娛樂頭條 6907℃

隨着人工智能技術的飛速迭代和應用場景的日益擴展,二級市場上的ai概念股迎來了新一輪的漲勢。

年初,sora的驚艷表現點燃了ai概念股的熱情,緊隨其後,國產長文本大模型概念股引領的ai應用板塊在上月強勢上揚,多隻股票漲停。不久前,音樂平台suno的問世,更是激發了音樂概念股的創新思考。進入2024年,隨着大模型向各行各業的深入推進,預計更多複雜而多元的應用場景將逐步實現,頻頻牽動二級市場的神經。

一年半前, chatgpt的發佈引爆全球對人工智能的廣泛關注,也引發了全球科技巨頭的新一輪ai軍備競賽。國內市場也不甘落後,各家圍繞核心算法、模型參數、計算能力等方面展開激烈的角逐。經過「深度學習框架優化」和「大規模預訓練模型研發」階段的技術爆炸,ai世界即將迎來巨大的變革和新一輪的角力。

2024年,openai發佈文生視頻大模型sora,開啟ai大模型在影視行業的全面落地。不甘落於人後的google也推出gemini,並宣布通過將gemini nano的衍生版本應用於智能手機,實現一系列智能化功能。隨後,sunov3模型橫空出世,開啟音樂領域的新一輪變革思考。業界預計,2024年將迎來ai應用爆發元年,ai將在各行各業落地實踐,ai商業化浪潮將加速襲來。

反觀國內市場,在這場浪潮中最先發聲的是崑崙萬維。4月17日,距離正式發佈自研千億級大語言模型「天工」一年時間後, 崑崙萬維發佈4000億參數全球最大規模的開源moe大模型——天工3.0。該模型採用4000億級參數moe混合專家模型,是全球模型參數最大、性能最強的開源moe模型之一。與此同時,還發佈了基於天工3.0打造的國內首個ai音樂生成大模型天工skymusic。

天工skymusic是中國首個實現音樂aigc sota的大模型,這一應用不僅為音樂產業帶來了創意與活力,也有望為ai技術在音樂藝術創作領域的應用開闢了新天地。

中國音樂的gpt時刻來了

崑崙萬維對音樂領域aigc的探索,其實早在2021年就已經開始。早期研發中,崑崙萬維選擇了行業普遍通用的符號生成路線,並走到了相對成型的階段。但由於符號生成路線只能生成樂譜而非音樂的弊端,以及生成音樂在人聲合成上的不理想。研發團隊全盤推翻成果,選擇了大模型音樂音頻生成路線,並決定攻克人聲演唱的行業難題。這意味着崑崙萬維需要在路線和人聲演唱這兩個業界幾乎沒有公開參考案例的領域,投入更多的研發資源和資金,做出更多的嘗試。

通過不斷的摸索,崑崙萬維終於摸索出一套自主研發的類sora架構,實現了對前版大模型的顛覆性超越。這套架構採用了encoder-dit-decoder結構,通過large-scale transformer 技術負責譜曲,diffusion transformer 負責演唱,ldm還原成高質量音頻。同時運用目前最大的,包含了2000萬首歌曲的音樂數據集訓練模型。

AI音樂概念爆發,中國音樂GPT時刻來了嗎? - 陸劇吧

作為中國首個實現音樂aigc sota的大模型,天工skymusic集成了在自然語言處理和音頻生成技術上的最新突破,使得ai音樂創作的表現達到新高度。

在多項前沿技術的配合以及2000萬首音樂的深度學習下,天工skymusic在中文效果、人聲自然度 、情感、唱法等方面都表現出色。能夠通過歌詞控制情緒變化,並實現如顫音、歌劇、吟唱等多種歌唱技巧,使生成的音樂作品情感更加豐富且貼合情境。還支持創作說唱、民謠、放克、古風、電子等多種音樂風格,用戶可以根據個人喜好定製音樂風格,體現在音樂創作上的靈活性和普適性。

此外在中文歌曲創作上,天工skymusic尤為出色。不僅能發音準確,咬字清晰,在中文人聲自然度、可懂度等方面均超越suno等同類產品,還能模仿粵語、四川話等中文特色方言,實現了音樂創作維度的多元化和個性化。

天工skymusic的發佈標誌着中國企業在音樂aigc領域的引領地位。它打破傳統音樂創作的高成本壁壘,助力音樂創作走向普惠與民主化,鼓勵更多獨立音樂人和普通用戶加入音樂創作隊伍,指數級提升音樂ugc內容的產出。同時它也能服務於專業音樂人,通過縮減詞曲創作、編曲等工作提升了音樂創作效率,讓快速創作和試驗新的音樂構思成為可能,從而促進音樂市場的擴容和行業生態的健康發展。

AI音樂概念爆發,中國音樂GPT時刻來了嗎? - 陸劇吧

隨着天工skymusic憑藉其尖端技術和獨特優勢,有效解決音樂創作中的諸多難題,無疑為音樂產業打開了全新的增量市場。天工skymusic可以賦能短視頻創作者,讓他們便捷地創作契合視頻內容的背景音樂,提升內容質量和觀眾體驗。在音樂教育領域,它能夠作為輔助教學工具,讓學生體驗實時音樂創作過程,增強學習興趣,推動音樂教育普及,或是圍繞它打造互動性強的在線音樂創作課程,豐富教育資源,讓更多人有機會接觸和實踐音樂創作。

4000億參數,全球最大開源moe大模型

作為國內較早一批布局aigc領域的企業,早在2022年12月時,崑崙萬維就正式發佈了「崑崙天工」aigc全系列算法與模型,並宣布模型開源,成為國內第一個全身心投入到aigc開源社區的公司。到了2023年4月17日,崑崙萬維正式發佈自研千億級大語言模型「天工」,隨後面向c端先後推出「天工ai搜索」,ai agent開發平台。2024年2月6日,崑崙萬維向全社會免費開放千億級參數大語言模型「天工 2.0」,並打造ai繪畫、數據分析等創新功能,進一步滿足文案創作、知識問答、代碼編程、邏輯推演、數理推算等多元化用戶需求。

相較於上一代「天工2.0」moe大模型,本次崑崙萬維發佈的「天工3.0」不僅是4000億參數全球最大規模的開源moe大模型,更在模型語義理解、邏輯推理、以及通用性、泛化性、不確定性知識、學習能力等領域擁有驚人的性能提升,其模型技術知識能力提升超過20%,數學/推理/代碼/文創能力提升超過30%。

邏輯推理能力的提升對於大模型解決複雜問題至關重要。在「天工3.0」ai搜索的研究模式中,模型能夠圍繞用戶的某個簡單指令進行相關問題的延伸,並實時判斷該段落信息是否需要聯網搜索,基於此實現對某個行業的細緻拆解分析、總結相關事件、拆解產業鏈地圖等複雜功能,並以結構化或思維導圖的形式進行最終展示,讓模型更「聰明」。

AI音樂概念爆發,中國音樂GPT時刻來了嗎? - 陸劇吧

在語義理解方面,需要更好地理解和處理用戶自然語言query中的複雜語義信息,包括隱喻、多義詞等。例如,在「天工3.0」ai搜索的增強搜索中,模型能夠針對用戶的複雜query進行拆解、細化,並進行追問、信息理解與補全,使其在自然語義理解方面性能更強,面對不確定性知識時表現更好,能夠更精準、高效地滿足用戶需求。

以最近在網絡上爆火的「成都迪士尼」為例,成都實際上並沒有迪士尼,而是因說唱歌手一句歌詞演變而來,令成都某居民區樓下的健身器材場地成為年輕人的熱門打卡地。崑崙萬維董事長兼ceo方漢介紹道,當向「天工3.0」ai搜索提問後,它不僅會把正確的信息搜出來,準確介紹成都迪士尼的由來,還會為用戶怎麼去玩兒做出規劃。

而圍繞大模型的主流落地方向ai agent(智能體),「天工3.0」針對模型獨立規劃、調用、組合外部工具及信息的能力進行了專項訓練,能夠獨立生成並調用代碼,完成包括產業研究、產品橫評、信息分析、圖片生成、圖表繪製等多種複雜用戶需求。

AI音樂概念爆發,中國音樂GPT時刻來了嗎? - 陸劇吧

在內容創作方面,「天工3.0」進行了全面的內容創作能力升級,其不僅能實現ai音樂生成、ai語音、ai對話、ai二次元漫畫生成等強大的內容創作能力,更是通過專項agent訓練實現了在對話中結合文本需求實時生成圖片、結合文本需求實時內容分析及圖表構建等能力,成為真正能搜、能寫、能讀、能聊、能聽、能說、能畫、能看、能唱的大模型,帶來全新的ai體驗升級。

對於天工3.0的一系列升級,華泰證券評價,「天工」大模型基礎穩固,持續迭代並圍繞模型不斷推出 ai 相關應用, 同時公司以增資等方式推進 ai 算力芯片的研發,布局 ai全產業鏈,有望建立起在人工智能賽道的長期競爭力。同時在今年3 月 30 日,崑崙萬維發佈 2024 年第一期限制性股票激勵計劃,面對核心技術(業務)人員定向增發配股。信達證券認為,「天工大模型 3.0」發佈在即,公司開啟員工激勵彰顯了自身的信心。

隨着天工3.0和天工skymusic昨日正式發佈,市場也有了回應。當天崑崙萬維股價上漲超3%,aigc板塊也迎來集體反彈。市場的積極回應,不僅意味着對崑崙萬維最新成果的認可,也折射出業界對音樂aigc技術即將引領產業變革的期待。

伴隨天工skymusic在c端市場的廣泛應用,將催化音樂aigc產業鏈上下游的協同發展,涵蓋版權管理、數字分發、音樂教育、娛樂互動等諸多領域,由此產生可期的經濟效益和社會價值。

ai音樂概念股熱度升溫

崑崙萬維創始人周亞輝曾判斷,未來三十年,人類社會很大的一個變化,是人類要從感知線,變成表達線,整個人類社會在自我表達側要翻1000倍;創作和自我表達是未來30年在整個社交和文化領域增長最快的曲線,會有越來越多人表達自我,表達對世界的理解、對社會事物的態度,表達越來越藝術化和趣味化。他表示,這種表達在過去很困難,因為工具門檻高,而未來30年是自我表達的30年,崑崙萬維要用ai把人類創作的門檻降得足夠低,讓人們更充分地實現自我表達。

可以看到,在agi領域,目前多數團隊都專註於智力的擴展和增強,幾乎沒有人關注ai如何幫助人們理解和更好地表達情感。agi的終極目的是更像「人」,但人是兼具感性、理性的,推理、邏輯思維、感知、情感理解、表達能力缺一不可,今天的大模型大多還是智力、理解、做題等,但缺少情感理解和表達的部分,目前這也是業內的一個很受關注的細分領域。因此,情感 agi 作為崑崙天工探索研究的一個重要方向,音樂正是其中的重要部分。

方漢認為,ai音樂生成技術的出現,並不是為了「切走了音樂行業的蛋糕」,而是使非專業人士也能輕鬆創作出具有一定水準的音樂作品,這將極大地拓展音樂創作者群體,讓更多普通人有機會參與到音樂創作中來,促進音樂內容的多樣化和個性化。隨着創作者群體的增多,市場上將出現大量的音樂素材,為音樂創作提供持續不斷的靈感來源,大大提高了行業整體的生產力和創新能力。

不只是音樂,方漢提到,崑崙萬維喊出崑崙萬維「all in agi與aigc」,從小說到漫畫到音樂、視頻進行大量研發投入,目的就是降低所有人創作門檻,更好地表達自己。

從suno的爆發,到國內天工3.0和skymusic的推動,ai音樂概念股的市場熱度持續升溫,投資者對於這一新興領域的關注度和投資熱情日益高漲。業內人士預計,和此前文生圖片、文生視頻等ai在內容創作領域的變革類似,ai在音樂領域的投資機會也值得關注。

ai音樂仍處於市場滲透的初級階段。隨着消費者認知的提升和市場需求的增長,ai音樂概念股的實際影響和長期價值不容忽視。隨着ai技術的不斷深入,音樂創作將變得更加智能化、個性化,從而滿足用戶多樣化的需求。例如,通過與音樂平台、唱片公司等合作,推動ai音樂的商業化進程,以及與社交、遊戲、影視等行業跨界融合,提供定製化的音樂解決方案,帶來更多的應用場景和商業機會,促進音樂產業的創新和發展,形成良性循環。

還有行業人士對記者分析指出,低成本、高效的ai音樂創作可能會催生出新的商業模式,如按需定製音樂服務、在線音樂創作工具訂閱等,為音樂產業帶來新的消費增長。以及面向教育領域,ai音樂創作可以幫助用戶快速感知音樂創作原理,嘗試多種音樂風格創作,為音樂產業培養孵化新一代人才。

標籤: 娛樂頭條