數字人五人談:為什麼需要另一個我

 數字人產業方興未艾,正快速走進我們的數字化生活、數字化運營和數字化治理的海量數字化轉型場景。從元宇宙的爆發到aigc的出圈,數字人的市場「生命力」日益旺盛,由概念化進入實質性發展和落地階段,在各領域形成規模化應用。

據悉,近兩年,中國聯通率先布局數字人技術研發與商業應用,去年正式推出了個人數字人、全真數字人、專業級虛擬數字人等數字人產品矩陣和全棧數字人技術。

近日,五位通信產業專家、學者走進中國聯通數字人製作中心,體驗全真數字人的製作過程,成為通信首批集體亮相數字人。

全真數字人初體驗

全真數字人又稱為2d數字人,通過對真人的表情、嘴型、肢體動作、聲音採集復刻,通過ai技術實現形象聲音驅動和多模態交互算法模型訓練,實現2d數字人智能生成和感知交互。

當天,全真數字人採集流程分兩步進行,五位專家先在綠幕前配合視頻拍攝以採集形象,接着配合錄音採集音色。

「初次接觸數字人拍攝確實有新奇甚至些許陌生感」,北京郵電大學教授呂廷傑向《通信產業報》全媒體記者表示,隨著錄制過程的進行,驚嘆於科技帶來的變革,並對未來生活的可能性產生更多期待。

「這是我第一次親身接觸數字人的生成過程。」《通信產業報》全媒體總編輯辛鵬駿表示,當你由一個物理人演變成一個數字人,需要計算機採集你足夠多的信息,包括動作、表情、聲音、嘴型、眼神等。這一切就好像是計算機認識你的過程。「當然,這還只是第一步。」

通過對人物拍攝視頻和錄製語音,中國聯通基於神經網絡的文本到語音(tts)合成系統,將梅爾頻譜圖轉換成時域波形樣本,實現語音復刻;基於對抗神經網絡(gan),融合較先進的光流估算方法對採集的形象進行訓練,增強五官細節、聲音與嘴型同步,實現形象復刻。最後通過visual token提取器、多模態動作表徵對文本、圖片、視頻進行數據提取,通過多模態交互模型合生視頻。

gsma大中華區戰略合作總經理龐策表示,數字人應用範圍不斷拓寬,賦能各應用領域。在以個性表達為主的虛擬人方面主要有兩個發展方向。一是由虛向實,建立原創虛擬形象應用於物理世界。例如以虛擬主播、品牌代言人、潮流體驗官等身份,拍攝廣告、雲打卡展覽、發佈品牌宣傳等活動。二是由實向虛,依據物理世界實際存在的個人,構建數字孿生虛擬人。這次受聯通邀請參與數字人製作就屬於數字孿生虛擬人,整個錄製過程40分鐘左右,包括視頻、動作、聲音採集等。真人數字孿生的應用場景已經越來越豐富,同時和人工智能技術結合,更能發揮出較大的商業價值。

敲開元宇宙大門

隨着數字人理論和技術日益成熟,運營商不斷探索數字人技術的應用範圍與場景。2023年7月聯通在線率先發佈「聯通全真數字人產品矩陣」,包括個人數字人、全真數字人主播、全真數字人直播、全真數字人客服、專業定製數字人,面向新聞、綜藝、體育、財經、氣象等電視節目研究虛擬形象合成技術,高效助力企業完成數字人模型播報內容,為企業打造專屬的ip形象,構築數字人產業鏈發展新格局。

5g中國創新百人會秘書長、中國互聯網協會應用創新委員會副主任張澤軒表示,隨着傳統通信業務的增長放緩,數字人產業作為一種新興的業務模式,為運營商提供了新的收入來源和增長點。數字人可以應用於客服、娛樂、教育、健康等多個領域,為運營商帶來新的商業機會。運營商發展數字人產業不僅能夠為其帶來商業上的益處,還能夠推動技術進步、提升服務質量、促進社會發展,並在全球範圍內提升競爭力。

「如何建設和運營人人可進入、人人能使用和人人有獲得感的創新性服務是目前元宇宙亟需突破的產業難題。中國聯通無疑在這一方面是具有開拓性的。」中國通信企業協會人工智能專委會副秘書長,工體元宇宙gtverse創始人、首席架構師葛頎表示,數字人承擔了個人消費者在元宇宙數字身份認證管理、數字社交憑證和數字資產平台等多重屬性,是企業和政府客戶在元宇宙提供2c服務、打造數字資產和提升數字收益的重要抓手,獲得了產業界、資本方和使用者的高度關注,從全球範圍看,迭代速度最快、微創新最多,更是使用頻次最高的雲宇宙應用。「數字人將率先幫助廣大的個人消費者和企業、政府用戶敲開元宇宙的大門。」

「此前,運營商已推出的數字人已應用於體育、文娛以及領導演講,此次為通信行業推出首批數字人非常值得稱讚。」呂廷傑表示,數字人不僅可以用於娛樂、遊戲、影視行業,還可以作為在線課程、虛擬主播、發言致辭等多種應用場景,為我們提供全新的交互方式和服務體驗。非常期待聯通數字人未來廣泛的應用。

做數字人的主場孵化器

通常數字人對算力、智力、運力、渲染、時延和藝術成長性等核心功能的要求高。完全私有化的網絡平台,成本高、安全性差且無法支持通用性智能終端。而中國聯通數字人產品中的聯通數字人小程序,僅需要上傳或者錄製一段2-3分鐘的本人視頻,採集口播動作和皮膚狀態,即可後台生成專屬數字分身,還原真人真貌。

葛頎表示,通過拍視頻、錄語音等低數字技能門檻的方式塑造數字人ui/ux,雲端大模型和標準化接口深度對接運營商的5g算網和ai能力,將個人數字資產與數字身份管理、實時渲染調優以及dof等有關個人隱私和地理位置等隱私數據由智能手機等多形態智能終端來承載,中國聯通打造的新型全息數字人方案具有便於消費者體驗和易於實現商業閉環的系統級優勢能力,能夠支持幾乎所有的智能手機用戶使用自己的終端體驗數字人等元宇宙新業務、新服務和新體驗。

辛鵬駿認為,中國聯通是最早推進數字人、元宇宙的運營商,是推進數字人的先鋒和領導者。聯通在線很早就在元宇宙、數字人領域探索、實踐,已經積累了豐富的應用。特別是聯通在海量彩鈴、視頻、5g新通話等基礎上的新業務衍生、ai視頻處理、算力模型搭建、算力匹配調度等方面,都積累了豐富的經驗。「擁抱開放」是聯通的最大優勢。所有新業務、新技術、新應用的生成路徑,核心就是開放。

據悉,為了更廣泛的推廣數字人技術,增強人們對於數字人的體驗,中國聯通將於2024年3月在中國聯通10省營業廳落地100個「數字人『綠屏間』體驗廳」。用戶前往數字人「綠屏間」,保持站定/坐着姿態,按照題詞內容錄製2-3分鐘讀稿視頻,就可以等待生成數字人形象。進一步加深用戶對數字人的認知與體驗。2024年,中國聯通將助力實現1億人擁有自己數字人。

龐策表示,目前,全球領先的電信運營商都在多個非傳統電信業務領域進行創新、探索和實踐,例如雲業務、aigc業務,元宇宙業務等。電信運營商擁有豐富的算力基礎設施資源,專業化的技術團隊以及廣泛的c端,b端客戶資源。對於數字人業務,非常值得運營商進行探索和嘗試。(崔亮亮)