被ChatGPT「複製」聲音,「寡姐」斯嘉麗發文怒斥,OpenAI緊急停用,生成式AI面臨深度偽造的新危機?

每經記者:文巧    每經編輯:蘭素英

當地時間5月20日,外媒npr獨家公布了被影迷稱為「寡姐」、科幻電影《她》中ai助手飾演者斯嘉麗·約翰遜發布的一篇聲明,斯嘉麗指控openai的chatgpt非法使用其聲音,同時要求將語音下架。

上周,openai發布了最新旗艦模型gpt-4o,引爆科技圈。在發布會上,openai展示了chatgpt最新語音功能,不少人發現,其富有表現力的合成聲音sky與《她》中斯嘉麗飾演的ai助手的聲音驚人地相似,這引發了激烈的討論。

斯嘉麗聲明稱,2023年9月,chatgpt推出語音模式時,openai曾找過她希望為其配音,但由於個人原因拒絕。就在gpt-4o演示前兩天,openai還曾試圖說服斯嘉麗,但在聯繫上之前,新模型就已發布。基於此,斯嘉麗的法律團隊此前已向openai發送兩封聲明,要求該公司詳細說明其開發這種聲音的過程。

由於斯嘉麗的指控,openai在當地時間5月19日發表聲明宣布暫停使用這款ai聲音模板。同時,作為回應,該公司也公布了chatgpt中5個配音的詳細創作流程,稱這是從400多名專業配音和演員中挑選出來的。

實際上,這已經不是openai初次面臨類似的指控。更早之前,《紐約時報》和《權力的遊戲》原著作者喬治·馬丁等在內的內容創作者都曾因版權問題將該公司告上法庭。而隨著這場鬥爭延伸至語音領域,外媒wired認為,這可能會帶來新的有關深度偽造的威脅。

「寡姐」斯嘉麗:chatgpt「偷」走我的聲音

「當我聽到發布演示時,我感到震驚、憤怒,並且不敢相信阿爾特曼會追求一種聽起來與我如此相似的聲音,以至於我最親密的朋友和新聞媒體都無法分辨。」斯嘉麗在聲明中這樣寫道。

圖片來源:npr記者bobby allyn的x賬號

實際上,自去年9月openai推出chatgpt的語音模式以來,sky的聲音就一直可用。chatgpt的語音模式一共有breeze、cove、ember、juniper和sky五種聲音。但直到上周openai演示了最新的旗艦ai模型gpt-4o模型,使聲音更具表現力時,sky的聲音與斯嘉麗的聯繫才變得清晰起來。

在上周的發布會上,openai展示了chatgpt最新語音功能,得益於反應速度的大幅提升,該功能幾乎等同「實時對話」。隨後,openai首席執行官阿爾特曼在x平台上發布了「her」這個詞,暗示科幻電影《她》已走入現實。不少人意識到,chatgpt中富有表現力的合成聲音與《她》斯嘉麗·約翰遜飾演的ai助手的聲音驚人地相似,由此引發了外界激烈的討論。

圖片來源:x平台

而斯嘉麗的聲明也指出,阿爾特曼用「她」來指代這部電影,似乎在鼓勵全世界將chatgpt最新演示與其表演聯繫起來

她在聲明中表示,2023年9月,chatgpt推出語音模式時,阿爾特曼找到她,詢問她是否願意為chatgpt配音,去安慰用戶,彌合ai與人類之間巨大的差異所帶來的不適感。斯嘉麗表示,經過深思熟慮後,她拒絕了這一提議。就在gpt-4o演示前兩天,openai還曾試圖說服斯嘉麗,但在聯繫上之前,新模型就已發布。基於此,斯嘉麗的法律團隊此前已向openai發送兩封聲明,要求該公司詳細說明其開發這種聲音的過程。

openai回應:暫停sky語音,chatgpt的5種聲音來自400多份投稿 

當地時間5月19日,openai表示公司正採取措施解決問題,同時正在暫停使用這款ai聲音模板。

該公司還公布了chatgpt中5個配音的詳細創作流程,稱每一種聲音都經過了長達五個月的精心挑選,且是從合作的配音演員中進行採樣的,且每位演員的報酬都高於市場最高水平。

圖片來源:openai官網

openai在聲明中寫道:「我們認為ai的聲音不應該刻意模仿名人的獨特聲音——sky的聲音不是對斯嘉麗·約翰遜的模仿,而是屬於另一位專業女演員,使用她自己自然的說話聲音。為了保護他們的隱私,我們不能分享我們配音演員的名字。」

據悉,2023年5月,openai的選角機構和選角導演發出了人才招募。不到一周,他們就收到了400多份配音演員和銀幕演員的投稿。將近5個月後,他們挑選出了5種聲音發布到chatgpt中。

該公司為chatgpt的聲音制定了一套標準,仔細考慮了每個聲音的獨特個性及其對全球觀眾的吸引力。這些標準包括:有不同背景或能說多種語言的演員;一種聽起來有「永恆」(timeless)感覺的聲音;一種平易近人、能激發信任的聲音;一種音色豐富,且溫暖、引人入勝、充滿自信、魅力十足的聲音;自然且易於聽取。

圖片來源:openai官網

深度偽造威脅或升級

《每日經濟新聞》記者注意到,斯嘉麗的指控已經不是openai初次面臨類似的鬥爭。

今年5月初,包括《紐約每日新聞》和《芝加哥論壇報》在內的多家報紙在紐約聯邦法院起訴openai和微軟,指控他們濫用新聞內容來訓練生成式ai系統。

去年12月,《紐約時報》在紐約南區法院向openai及其投資人微軟公司提起侵犯版權訴訟;同月,多名普利策獎得主也起訴openai和微軟濫用自己作品訓練大模型,指出這樣的行為無疑是在「刮取」作家們的作品和其他受版權保護的材料。

更早之前,去年9月,美國作家協會以及包括《權力的遊戲》原著作者喬治·馬丁在內的17位美國著名作家對openai發起集體訴訟,稱openai在未經授權的情況下使用原告作家的版權作品訓練其ai模型。

openai面臨的難題也揭示了整個生成式ai領域與內容創作者之間權益邊界的普遍性問題。

據媒體引用不完全統計數據稱,自2022年11月至2023年10月,僅美國加州北區法院便已經受理了10起版權人起訴stabilityai、openai、meta、alphabet等公司未經授權,利用版權作品進行模型訓練的案件。

外媒wired評論稱,與斯嘉麗的衝突將加劇openai與藝術家、作家和其他創意人士之間的現有鬥爭。隨著這場爭鬥蔓延至語音領域,wired認為,生成式ai使創建逼真的合成聲音變得更加容易,這可能會帶來新的有關深度偽造的威脅

實際上,openai今年3月就曾表示,它已經開發出一種可以從15秒的剪輯中克隆某人聲音的技術,但該公司表示不會發布該技術,因為它可能會被濫用。

每日經濟新聞