界面新聞記者 | 於浩
界面新聞編輯 | 文姝琪
輸入音樂流派風格、內容主題,只需幾秒鐘內就可生成2分鐘音樂......生成式人工智能再次在音樂領域為人們帶來驚喜。
近日,人工智能初創企業suno對外發佈了suno模型v3版本。據介紹,在v2版本基礎上,v3版本增加了更多音樂風格和流派,同時也加強了對提示詞的依從性,減少了幻覺問題。
目前suno v3支持自定義模式,用戶可以在自定義模式中通過輸入歌詞、標題、音樂風格、勾選是否純器樂來生成音樂作品;也可以在非自定義模式下以更為簡單的提示詞生成作品。
界面新聞以「a jazz song that describes happy love(一首描述幸福戀愛的爵士樂歌曲)」作為提示詞輸入suno v3,以下為模型生成的音樂作品鏈接及歌詞:(歌詞翻譯由kimi智能助手完成)
https://app.suno.ai/song/c066c053-e038-493b-a48d-095a9891b1cb
the moon is shining bright above
月光皎潔,高懸天際
as we sway to the rhythm of love
我們隨着愛的旋律輕輕搖擺
your touch, it sets my heart on fire
你的輕撫,如火點燃我的心房
in this moment, nothing could be higher
此刻情深,無物能及
the sweet melody fills the air
甜美旋律,充盈夜空
as we dance without a care
我們翩翩起舞,無憂無慮
your eyes, they sparkle like stars
你的雙眸,如繁星般璀璨
in this jazz embrace, we're taking it far
在爵士的懷抱里,我們遨遊至遠方
oh, this love is like a moonlit serenade
哦,此情此景,宛如月下小夜曲
a harmony that will never fade
和諧旋律,永不消逝
in your arms, i find my solace and peace
在你懷中,我尋得安寧與寧靜
together, we create a love masterpiece
攜手共繪,愛的絕世佳作
據滾石雜誌報道,suno創業團隊僅成立不到兩年時間,由mikey shulman、keenan freyberg、georg kucsko和martin camacho聯合創立。四人都是機器學習方面的專家,此前曾一同就職於人工智能企業kensho。其中,shulman和camacho也是音樂家,常常一同即興演出。
在技術路徑方面,與chatgpt等大語言模型類似,suno將人類語言以token為單位進行分解,吸收其用法、結構之後再根據需求進行重新輸出。但與可以被輕易拆分的純文本不同,音頻往往以連續信號的形式出現,這使得ai對音樂的理解和生成變得更加困難。
相似的訓練思路使得suno可能面臨openai所遭受的版權訴訟。2023年12月,《紐約時報》曾以侵犯版權為由起訴openai和微軟,要求兩家公司銷毀任何使用到《紐約時報》版權材料的聊天機械人模型和訓練數據。suno創始團隊並未透露模型的訓練數據,只透露了模型會通過學習語音錄音來了解人類聲音的特質。
suno v3發佈後,suno創始團隊於社交媒體上發文表示,目前suno模型仍處於早期階段,未來還將沿着質量、可控和速度上進行改進,並透露v4正在開發中。同時,為了防止模型作品被濫用,suno還開發了專有的無聲水印技術,用以檢測歌曲是否是使用suno創作的。
在人工智能音樂創作方面,如谷歌、stability ai都曾發佈過類似產品,谷歌的dream track支持用戶使用名人聲音製作自己的歌曲,stability ai所發佈的stable audio ai則可以生成45秒左右的曲目。
目前suno只有12名左右員工,但在上述報道中創始團隊表示他們計劃擴大規模。與此同時,他們也表示目前suno模型還沒接近完美,還有大量的工作要去做。其中一個方向是,suno希望能以更直觀的交互方式來替換文本轉音樂的方案,如根據用戶自己的演唱生成歌曲。