李玟復活,一場鬧劇

作者 | 南風窗記者 朱秋雨

「大家好,我是高以翔godfrey。雖然我已經離開了這個世界,但我的心永遠與你們在一起。你們的留言我都有看到,你們是我最寶貴的財富,我永遠愛你們。」

3月,一個西裝革履、手戴腕錶與梳着大背頭的「高以翔」,用台灣腔出現在社交媒體上。與他一起在人們視野前表達對粉絲思念的,還有已故明星李玟、喬任梁、科比、張國榮……

唯一的不同是,製作者在一旁特別標註:「視頻和聲音均由ai生成。」 

少數人在視頻底下表達他們感受到的怪異。李玟粉絲指出,ai李玟在聲色上與原版很像,但在口音、停頓、說話情感上仍有很大的差異。「這根本不是coco也不是類coco,她只是一個套了殼子、內核是不知名人士的虛擬形象,甚至還可能被發展成商品。」

ai復活技術的確已經變成了產業鏈。在各類短視頻平台,許多博主打着科技向善的名號,售賣ai復活技術。多位博主給記者報價:

讓逝者照片動起來並說話,298元;

克隆逝者聲音與視頻,1498元……

而經南風窗記者實測,當下流行的ai語音克隆和數字人技術,門檻並不高,市面上有眾多非常成熟的開源項目。服務者可以用低廉的成本,每日輕鬆「復活」多人。

更深的矛盾由明星父母戳破。3月16日,喬任梁父親對媒體表示,他已經看到網上傳播的「兒子被複活」影像,「不能接受,感到不舒適」。「他們未徵求我們同意,是我侄女刷到視頻發給我的,這是在揭傷疤。」

關於技術與人文的糾葛被擺在了面前。這究竟是一個改善人們面對死亡創傷的技術,還是在扭曲我們的現實感?

01

復活明星

ai復活的力量,許多人是從一位明星父親——音樂人包小柏處得知的。

3月,他在接受媒體時,展現了ai復活女兒的「模樣」。

面對多家媒體記者,他首先對着手機說:「包小容,我現在正在接受採訪,你跟媒體的朋友打聲招呼吧。」

手機程序里的「包容」在等待了一段時間後,開口說道:「媒體朋友好,很高興認識你。」

據包小柏表示,這個ai「包容」是他與好友劉岩的公益項目,通過女兒生前17秒影像,再加上他與太太對女兒生前20年的回憶,訓練出來的虛擬人物。經過8個月的努力,「包容」終於由此回到了包小柏身邊,可以與人對話、唱歌、實時互動。

女兒成功「復活」的經歷讓包小柏感觸萬千。他成立了一家名為「愛語包容」的公司,對外表示:「長久以來,ai對大眾來說都是負面的,不是詐騙就是取代人類工作。但ai也可以有好的用途。」 

他認為,ai復活技術能成為一種陪伴,「即使都知道這是假的,也還是會欣然接受。」

類似的「心靈撫慰」,在巨星李玟逝世多月後,在互聯網流傳開。3月13日,一個身着藍色牛仔上衣,編着側邊辮的李玟,活潑地出現在人們的面前。她對着鏡頭說著上述「高以翔」的話,勾起了一眾ai博主的創作欲。

3月,一位自稱「太太是李玟粉絲」的博主,在b站記錄了自己復活李玟的過程。他首先在互聯網上篩選了李玟的原聲,進行處理後,將乾淨的聲音放入ai模型。他以為,經過一晚上的運算和訓練後,李玟的聲音已經被複原了95%以上。

視頻發出後,他收到很多粉絲的提醒,只考慮到了李玟的聲線和聲色,「但實際上,我並沒有考慮到太多她用到的語氣和口頭禪」。

這位博主接着進行了第二次的創作。這次,他在克隆李玟時,着重把口頭禪標記出來以後,「建立出coco口頭禪模型」。經過接近4天,每次1000輪的訓練,他最終克隆出李玟的語音模型。他由此創作了ai李玟給粉絲的4分鐘語音。

「我是coco李玟,好久不見,我知道你們想念我。」

「中國呢,有一句俗語,叫『天下沒有不散的宴席』,也許我們每個人都是彼此生命當中的過客,but我更喜歡英文中的一句話,『everything happend is good』。所有發生的事情都有好的一面,那對於我來說,最好的事情就是停止在有你們愛着的那一刻,我真的感覺很幸福。」

聽完這些話,許多人表示淚目,稱讚他用ai造夢。

但底下點贊最熱的評論,代表了部分粉絲對此做法的不滿。「我支持對已逝藝人的作品進行創作,但我反對就其人格進行模仿,這太冒犯了。」

「ai coco口口聲聲感恩粉絲她很欣慰,但真正的她在迷離之際難道不會是痛苦或絕望的嗎?誰能真的去複製另一個人的人格呢?」

02

近乎零成本

爭議本身並非來源於技術。但「ai復活」可以囊括的技術手段、實現主體都非常多樣,這讓人面對技術的進步,產生了複雜又混亂的情緒。

包小柏的情況是更特殊的。花費這位明星父親大量精力復活女兒時,他們追求的是建造出一個與包容相似的數字人物。這需要親屬對逝者的人生節點、性格、生前影像的重建與記錄,依賴極大的數據。

但外人復活明星的話,難度就小很多了。市面上許多的ai復活套餐,也是如此兜售的——將親人生前影像、聲音或照片交給ai,讓ai訓練出一個語音模型或數字人。接着,消費者可以提供一段希望ai親人想說的話,讓ai說出來。

90後的張琳就是這樣,在今年春節找到了ai復活網紅博主,想復活摯愛的外婆。她對外婆的逝世已經釋懷,行動的目的來源於全家人的共識——外公高齡九十,對伴侶的逝世很可能無法接受。

為此,全家人瞞着這位老人數月,一直欺騙他:外婆仍因為腿腳不好,躺在醫院住院。

張琳告訴南風窗,全家人都打算繼續這個善意的謊言,於是想用ai復活外婆的語音,與外公對話。

樸素的願望最終以1000元實現了——她把外婆生前3分鐘的粵語對話交給上述團隊,對方在1天後表示,模型訓練出來了。接着,他讓張琳模仿外婆的語氣、語音習慣說一段話,他再將這段話放給訓練好的「外婆」,很快就得到了張琳想要的效果。

「音頻出來的第一下,大部分親人覺得震驚嚇了一跳,」她回憶,「音色是很像很像的,(相似度)能有95%吧。」

這是市面上多數ai復活博主主打的業務。阿亮,一位ai復活博主曾告訴南風窗,當下的業務主要有三類,第一是ai的數字分身服務。第二類是說話服務,本質上是把一張照片變成一個視頻,「他們其實想讓親人說一段祝福的話就可以了」。第三類是一項純文字的、與親人對話溝通服務。

根據南風窗的調查,在業內,上述收費從幾百元至萬元不等。

但南風窗記者發現,這類生意主打的是信息差。第一項數字分身服務,在國際上,character ai、heygen ai等公開軟件,已經推出了成熟的服務。

以heygen為例,該項目由華人創業團隊打造,在2023年發佈instant avatar定製數字人服務。用戶只要上傳自己兩分鐘以上吐字清晰、光照合適的正面視頻,就可以擁有屬於自己聲音、外貌的數字人。

而這項定製數字人服務以會員制收費,支持25種語言(包括中文)。只需一個月付費49美元(約合352元),用戶即可享受高級定製服務。今後,輸出相關文字,即可讓有你外表的數字人,用你的聲音說話。

b站ai語音博主kevin向南風窗介紹,在ai語音合成領域,市面上存在很多開源的項目。例如,2024年新推出的開源項目gpt-sovits,可以簡單便捷地實現ai語音克隆。

因為大量開源項目的存在,kevin認為,完成ai復活對博主而言幾乎是零成本,「頂多需要幾台搭載gpu的計算機設備」。再加上ai雲服務的興起,業界流行租賃gpu雲服務,以達到運行ai模型所需的算力。

「花個幾塊錢租1小時(ai雲服務),熟練的話1小時可以訓練出來五六個模型。基本上訓練一個模型沒有什麼成本。」kevin說。

一切沒有想像中的複雜。

kevin告訴南風窗,ai克隆語音技術,早在chatgpt之前便已經在業界存在,一般是基於名叫tts(text to speech)的技術。在國內,最早做tts的商業公司是當今ai龍頭公司,科大訊飛。

而2022年末大模型的爆發,激起了技術界和商業公司對ai語音克隆的興趣。入局者將這項技術越推越快。

「現在,只需1分鐘的語音素材,等待大概10分種訓練結束後,就可以生成與原聲90%相似度的克隆模型。」 kevin介紹。

這些進步得益於算法的創新。他表示,英文軟件和模型相比中文的用時更短,效果更驚艷。「有的開源英文模型,已經實現用戶上傳10秒語音,就能克隆得比較像了。」

03

技術的邊界

只是,當ai復活的人們在2024年充斥互聯網時,許多人開始感到不適。

這個不適也許是對技術本身的批判,另一方面,「和真人比,ai的還是不像」,很多人說道。

一個微博李玟粉絲大v告訴南風窗,在ai李玟的視頻充斥互聯網時,她想點擊進去看偶像,但「打開聽了幾句就關了,感覺好假」。

這也是當下許多ai克隆語音技術的局限性。如果想要復活熟悉的人,並讓他在日常生活中實現陪伴,你會發現,技術的門檻仍可能把很多人絆住。

kevin告訴南風窗,ai雖然對音色的模仿度很高,但對於說話者的口癖、停頓仍較難模仿。「比如,有的人說話會倒吸一口氣,這是ai開源項目很難做出來的(效果)。」另外,模仿人類的情緒,生氣、失望,都對當下的ai克隆技術是挑戰。

2024年3月,國內ai頭部公司商湯科技在年會上,復活了去年底因病逝世的創始人湯曉鷗。

在預先剪輯的視頻里,ai湯曉鷗會喝水,會開玩笑,對員工抑揚頓挫地說:「去年大家都覺得挺不容易的,但我認為,難的事情總會過去。最終,我們會像《漫長的季節》里的結尾,在苞米地里坐着小火車,突突地往前開。」

商湯糰隊在接受採訪時披露,為了還原湯曉鷗,這個9分鐘的視頻運用商湯「如影」技術,由幾位專業同事合作完成。它摘錄了大量湯曉鷗生前的語錄,前後用時2個月,調整了五六版,才得出了如今的ai湯曉鷗。

也就是說,理想的ai復活,它不僅需要生者大量的高質量語音素材,還是細節、時間與技術三者的結合。

更難的是像包小柏一樣,使生者與ai復活的數字人實時對話。這其中運用了三種技術:大語言模型,用於實時生成對話;ai語音合成技術(tts),用於將文字轉化成語音;ai數字人,用於讓ai形象在手機上展現。

當南風窗記者以消費者名義諮詢一位名叫「ai朱廠長」的復活博主時,他表示, ai實時對話需要耗費大量算力。「光硬件成本就得四五十萬,還不包括程序開發和維護。」因此,「廠長」說:市面上的博主基本無法做到實時對話。

他還補充道:「做你說的這種,需要六七個高手,干半年。」

技術的門檻依然存在,ai復活的明星離真人仍差距甚遠。但ai復活的視頻已經在算法和流量的助推下,越傳越廣。

3月16日,在喬任梁父母、高以翔親屬方都表達了對ai復活的不適後,許多博主終於發現,這一舉動涉嫌侵犯肖像權。據我國《民法典》第13條,逝者的姓名、肖像、名譽、榮譽、隱私、遺體等受到侵害的,其配偶、子女、父母等有權依法請求行為人承擔民事責任。

也就是說,被ai復活的明星親屬,有權向視頻創作方追責。

不少復活博主在此後下架了ai喬任梁、ai李玟……

但無法阻擋地,ai喬任梁仍在互聯網上被多次轉發、流轉。人們從明星父母的反對聲中再次得知了這一飛速發展的技術。

「確實挺嚇人的。它基本上沒有成本,如果是不法分子用了這個技術,可以同時訓練、模仿很多人。」研究ai的kevin感嘆。

人類再次站在了選擇的岔路口。技術迅速地跑在了所有人的面前。現在如20世紀技術哲學奠基者弗里德里奇·德紹爾形容:「現代技術改變世界,也見證了其超出經驗的道德價值。人類創造了技術,但它的力量就像一座山、一條河、一個冰川紀或者行星。它超過了世界上本來的各種力量。」

當下,只有歐盟出台了相關約束方案。

2024年3月,歐盟通過了全球第一個《人工智能法案》。高度謹慎的歐盟將深度偽造技術歸類為「有限風險」ai系統。

這意味着,對深度合成技術的管理,以預防為主,仍未觸及懲罰措施。歐盟要求開發人員實施技術保障措施,防止技術的濫用。例如,對ai輸出內容,要留下水印。

-end-

編輯 | 向由

值班編輯 | 阿樹

排版 | 起起

南風窗新媒體 出品

未經授權 禁止轉載

關注南風窗,查看更多精彩內容