丰色 发自 凹非寺
量子位 | 公众号 qbitai
这两天,一个神秘的“音乐版sora”产品被盛传即将发布,suno和它比起来都不算什么。
知情者评价be like:
比suno强两倍。
模型相当强悍。
人工智能音乐很快就会席卷全球。
(suno:刚刚火爆的一款ai音乐创作工具,火到200多名音乐人联名签公开信抗议)
正当大家的胃口被吊得十足之时,这个神秘产品的首批演示泄露了。
一首赞颂xgboost算法的hip hop风:
一首带着年代感的女声独唱,时长达1分37秒,歌词还在嘲讽suno:
第一个demo由英伟达工程师bojan tunguz发布,随后很快删除,但手快的网友早已存档。
第二个则来自匿名用户投稿。
不得不说,两首曲子咱这“肉耳”听着都相当带感,让人忍不住跟着嗨起来~
有网友甚至评价:
这和spotify上的歌几乎没什么区别。
“音乐版sora”初揭秘
随着第一批demo的泄露,这款“音乐版sora”的真身也被神通广大的网友扒出:
可能是一个叫做udio的产品。
除了生成高质量的音乐,还有简单的视频生成能力——根据目前的观察,这里的视频应该是带有动态效果的专辑封面。
从网友爆料的接口返回图来看:
udio支持文字描述生成音乐,比如“一首关于纽约的爵士”;
也支持艺术家风格模仿(但不包括声音);
支持自定义歌词;
也支持对自己喜欢的曲目进行remix;
最后还有一个手动模式。
产品本身还未公开发布,目前采取邀请测试的方式:
udio官网一打开就只有登陆界面,需要验证资格。
产品本身似乎也对拿到资格的人也提出了要求:
在公开发布之前,不能在社交媒体上发布任何演示内容。(所以英伟达大哥才很快删帖吧)
目前,我们也只看到少量博主称自己得到了试用资格。
包括专门关注ai相关的账号、投资人、电影人等等。
唯一的共同点是,他们给出的评价都很高:
和sora一个级别,只不过是音乐领域的。
体验完了,不敢相信,suno只是2024年ai音乐生成的开始。
有人甚至称它比suno好10倍。但对此,有网友立马站出来反对:
也许是炒作宣传。比suno好,但应该没有那么强。大家理性吃瓜。
究竟如何我们暂且不论。
值得一提的是,由于目前仅有的两个demo中有一个泄露自英伟达工程师,有网友也大胆猜测两者是否有合作:
英伟达要进军ai音乐产业吗?(手动狗头)
one more thing
今年的ai音乐圈似乎真有来势汹汹之势:
除了横空出世、备受好评的suno,几天前stability ai也卷起来了。
他们发布的新模型stable audio 2.0,直接可以创作长达3分钟的音频。
相比之下,suno目前也只支持2分钟。
而纵观国内,如网易云这种“业内之人”其实也早在搞了。
ai在音乐生成上的“造诣”,咱们就且拭目以待。
参考链接:
[1]https://twitter.com/kimmonismus/status/1776940895197139200
[2]https://x.com/rom_creating/status/1777082882668065127
[3]https://x.com/legit4k/status/1777088263691329837
[4]https://twitter.com/maxescu/status/1776899373294584102
[5]https://twitter.com/legit4k/status/1777007767464673663
[6]https://x.com/mckaywrigley/status/1776328189209723192