李玟复活,一场闹剧

作者 | 南风窗记者 朱秋雨

“大家好,我是高以翔godfrey。虽然我已经离开了这个世界,但我的心永远与你们在一起。你们的留言我都有看到,你们是我最宝贵的财富,我永远爱你们。”

3月,一个西装革履、手戴腕表与梳着大背头的“高以翔”,用台湾腔出现在社交媒体上。与他一起在人们视野前表达对粉丝思念的,还有已故明星李玟、乔任梁、科比、张国荣……

唯一的不同是,制作者在一旁特别标注:“视频和声音均由ai生成。” 

少数人在视频底下表达他们感受到的怪异。李玟粉丝指出,ai李玟在声色上与原版很像,但在口音、停顿、说话情感上仍有很大的差异。“这根本不是coco也不是类coco,她只是一个套了壳子、内核是不知名人士的虚拟形象,甚至还可能被发展成商品。”

ai复活技术的确已经变成了产业链。在各类短视频平台,许多博主打着科技向善的名号,售卖ai复活技术。多位博主给记者报价:

让逝者照片动起来并说话,298元;

克隆逝者声音与视频,1498元……

而经南风窗记者实测,当下流行的ai语音克隆和数字人技术,门槛并不高,市面上有众多非常成熟的开源项目。服务者可以用低廉的成本,每日轻松“复活”多人。

更深的矛盾由明星父母戳破。3月16日,乔任梁父亲对媒体表示,他已经看到网上传播的“儿子被复活”影像,“不能接受,感到不舒适”。“他们未征求我们同意,是我侄女刷到视频发给我的,这是在揭伤疤。”

关于技术与人文的纠葛被摆在了面前。这究竟是一个改善人们面对死亡创伤的技术,还是在扭曲我们的现实感?

01

复活明星

ai复活的力量,许多人是从一位明星父亲——音乐人包小柏处得知的。

3月,他在接受媒体时,展现了ai复活女儿的“模样”。

面对多家媒体记者,他首先对着手机说:“包小容,我现在正在接受采访,你跟媒体的朋友打声招呼吧。”

手机程序里的“包容”在等待了一段时间后,开口说道:“媒体朋友好,很高兴认识你。”

据包小柏表示,这个ai“包容”是他与好友刘岩的公益项目,通过女儿生前17秒影像,再加上他与太太对女儿生前20年的回忆,训练出来的虚拟人物。经过8个月的努力,“包容”终于由此回到了包小柏身边,可以与人对话、唱歌、实时互动。

女儿成功“复活”的经历让包小柏感触万千。他成立了一家名为“爱语包容”的公司,对外表示:“长久以来,ai对大众来说都是负面的,不是诈骗就是取代人类工作。但ai也可以有好的用途。” 

他认为,ai复活技术能成为一种陪伴,“即使都知道这是假的,也还是会欣然接受。”

类似的“心灵抚慰”,在巨星李玟逝世多月后,在互联网流传开。3月13日,一个身着蓝色牛仔上衣,编着侧边辫的李玟,活泼地出现在人们的面前。她对着镜头说着上述“高以翔”的话,勾起了一众ai博主的创作欲。

3月,一位自称“太太是李玟粉丝”的博主,在b站记录了自己复活李玟的过程。他首先在互联网上筛选了李玟的原声,进行处理后,将干净的声音放入ai模型。他以为,经过一晚上的运算和训练后,李玟的声音已经被复原了95%以上。

视频发出后,他收到很多粉丝的提醒,只考虑到了李玟的声线和声色,“但实际上,我并没有考虑到太多她用到的语气和口头禅”。

这位博主接着进行了第二次的创作。这次,他在克隆李玟时,着重把口头禅标记出来以后,“建立出coco口头禅模型”。经过接近4天,每次1000轮的训练,他最终克隆出李玟的语音模型。他由此创作了ai李玟给粉丝的4分钟语音。

“我是coco李玟,好久不见,我知道你们想念我。”

“中国呢,有一句俗语,叫‘天下没有不散的宴席’,也许我们每个人都是彼此生命当中的过客,but我更喜欢英文中的一句话,‘everything happend is good’。所有发生的事情都有好的一面,那对于我来说,最好的事情就是停止在有你们爱着的那一刻,我真的感觉很幸福。”

听完这些话,许多人表示泪目,称赞他用ai造梦。

但底下点赞最热的评论,代表了部分粉丝对此做法的不满。“我支持对已逝艺人的作品进行创作,但我反对就其人格进行模仿,这太冒犯了。”

“ai coco口口声声感恩粉丝她很欣慰,但真正的她在迷离之际难道不会是痛苦或绝望的吗?谁能真的去复制另一个人的人格呢?”

02

近乎零成本

争议本身并非来源于技术。但“ai复活”可以囊括的技术手段、实现主体都非常多样,这让人面对技术的进步,产生了复杂又混乱的情绪。

包小柏的情况是更特殊的。花费这位明星父亲大量精力复活女儿时,他们追求的是建造出一个与包容相似的数字人物。这需要亲属对逝者的人生节点、性格、生前影像的重建与记录,依赖极大的数据。

但外人复活明星的话,难度就小很多了。市面上许多的ai复活套餐,也是如此兜售的——将亲人生前影像、声音或照片交给ai,让ai训练出一个语音模型或数字人。接着,消费者可以提供一段希望ai亲人想说的话,让ai说出来。

90后的张琳就是这样,在今年春节找到了ai复活网红博主,想复活挚爱的外婆。她对外婆的逝世已经释怀,行动的目的来源于全家人的共识——外公高龄九十,对伴侣的逝世很可能无法接受。

为此,全家人瞒着这位老人数月,一直欺骗他:外婆仍因为腿脚不好,躺在医院住院。

张琳告诉南风窗,全家人都打算继续这个善意的谎言,于是想用ai复活外婆的语音,与外公对话。

朴素的愿望最终以1000元实现了——她把外婆生前3分钟的粤语对话交给上述团队,对方在1天后表示,模型训练出来了。接着,他让张琳模仿外婆的语气、语音习惯说一段话,他再将这段话放给训练好的“外婆”,很快就得到了张琳想要的效果。

“音频出来的第一下,大部分亲人觉得震惊吓了一跳,”她回忆,“音色是很像很像的,(相似度)能有95%吧。”

这是市面上多数ai复活博主主打的业务。阿亮,一位ai复活博主曾告诉南风窗,当下的业务主要有三类,第一是ai的数字分身服务。第二类是说话服务,本质上是把一张照片变成一个视频,“他们其实想让亲人说一段祝福的话就可以了”。第三类是一项纯文字的、与亲人对话沟通服务。

根据南风窗的调查,在业内,上述收费从几百元至万元不等。

但南风窗记者发现,这类生意主打的是信息差。第一项数字分身服务,在国际上,character ai、heygen ai等公开软件,已经推出了成熟的服务。

以heygen为例,该项目由华人创业团队打造,在2023年发布instant avatar定制数字人服务。用户只要上传自己两分钟以上吐字清晰、光照合适的正面视频,就可以拥有属于自己声音、外貌的数字人。

而这项定制数字人服务以会员制收费,支持25种语言(包括中文)。只需一个月付费49美元(约合352元),用户即可享受高级定制服务。今后,输出相关文字,即可让有你外表的数字人,用你的声音说话。

b站ai语音博主kevin向南风窗介绍,在ai语音合成领域,市面上存在很多开源的项目。例如,2024年新推出的开源项目gpt-sovits,可以简单便捷地实现ai语音克隆。

因为大量开源项目的存在,kevin认为,完成ai复活对博主而言几乎是零成本,“顶多需要几台搭载gpu的计算机设备”。再加上ai云服务的兴起,业界流行租赁gpu云服务,以达到运行ai模型所需的算力。

“花个几块钱租1小时(ai云服务),熟练的话1小时可以训练出来五六个模型。基本上训练一个模型没有什么成本。”kevin说。

一切没有想象中的复杂。

kevin告诉南风窗,ai克隆语音技术,早在chatgpt之前便已经在业界存在,一般是基于名叫tts(text to speech)的技术。在国内,最早做tts的商业公司是当今ai龙头公司,科大讯飞。

而2022年末大模型的爆发,激起了技术界和商业公司对ai语音克隆的兴趣。入局者将这项技术越推越快。

“现在,只需1分钟的语音素材,等待大概10分种训练结束后,就可以生成与原声90%相似度的克隆模型。” kevin介绍。

这些进步得益于算法的创新。他表示,英文软件和模型相比中文的用时更短,效果更惊艳。“有的开源英文模型,已经实现用户上传10秒语音,就能克隆得比较像了。”

03

技术的边界

只是,当ai复活的人们在2024年充斥互联网时,许多人开始感到不适。

这个不适也许是对技术本身的批判,另一方面,“和真人比,ai的还是不像”,很多人说道。

一个微博李玟粉丝大v告诉南风窗,在ai李玟的视频充斥互联网时,她想点击进去看偶像,但“打开听了几句就关了,感觉好假”。

这也是当下许多ai克隆语音技术的局限性。如果想要复活熟悉的人,并让他在日常生活中实现陪伴,你会发现,技术的门槛仍可能把很多人绊住。

kevin告诉南风窗,ai虽然对音色的模仿度很高,但对于说话者的口癖、停顿仍较难模仿。“比如,有的人说话会倒吸一口气,这是ai开源项目很难做出来的(效果)。”另外,模仿人类的情绪,生气、失望,都对当下的ai克隆技术是挑战。

2024年3月,国内ai头部公司商汤科技在年会上,复活了去年底因病逝世的创始人汤晓鸥。

在预先剪辑的视频里,ai汤晓鸥会喝水,会开玩笑,对员工抑扬顿挫地说:“去年大家都觉得挺不容易的,但我认为,难的事情总会过去。最终,我们会像《漫长的季节》里的结尾,在苞米地里坐着小火车,突突地往前开。”

商汤团队在接受采访时披露,为了还原汤晓鸥,这个9分钟的视频运用商汤“如影”技术,由几位专业同事合作完成。它摘录了大量汤晓鸥生前的语录,前后用时2个月,调整了五六版,才得出了如今的ai汤晓鸥。

也就是说,理想的ai复活,它不仅需要生者大量的高质量语音素材,还是细节、时间与技术三者的结合。

更难的是像包小柏一样,使生者与ai复活的数字人实时对话。这其中运用了三种技术:大语言模型,用于实时生成对话;ai语音合成技术(tts),用于将文字转化成语音;ai数字人,用于让ai形象在手机上展现。

当南风窗记者以消费者名义咨询一位名叫“ai朱厂长”的复活博主时,他表示, ai实时对话需要耗费大量算力。“光硬件成本就得四五十万,还不包括程序开发和维护。”因此,“厂长”说:市面上的博主基本无法做到实时对话。

他还补充道:“做你说的这种,需要六七个高手,干半年。”

技术的门槛依然存在,ai复活的明星离真人仍差距甚远。但ai复活的视频已经在算法和流量的助推下,越传越广。

3月16日,在乔任梁父母、高以翔亲属方都表达了对ai复活的不适后,许多博主终于发现,这一举动涉嫌侵犯肖像权。据我国《民法典》第13条,逝者的姓名、肖像、名誉、荣誉、隐私、遗体等受到侵害的,其配偶、子女、父母等有权依法请求行为人承担民事责任。

也就是说,被ai复活的明星亲属,有权向视频创作方追责。

不少复活博主在此后下架了ai乔任梁、ai李玟……

但无法阻挡地,ai乔任梁仍在互联网上被多次转发、流转。人们从明星父母的反对声中再次得知了这一飞速发展的技术。

“确实挺吓人的。它基本上没有成本,如果是不法分子用了这个技术,可以同时训练、模仿很多人。”研究ai的kevin感叹。

人类再次站在了选择的岔路口。技术迅速地跑在了所有人的面前。现在如20世纪技术哲学奠基者弗里德里奇·德绍尔形容:“现代技术改变世界,也见证了其超出经验的道德价值。人类创造了技术,但它的力量就像一座山、一条河、一个冰川纪或者行星。它超过了世界上本来的各种力量。”

当下,只有欧盟出台了相关约束方案。

2024年3月,欧盟通过了全球第一个《人工智能法案》。高度谨慎的欧盟将深度伪造技术归类为“有限风险”ai系统。

这意味着,对深度合成技术的管理,以预防为主,仍未触及惩罚措施。欧盟要求开发人员实施技术保障措施,防止技术的滥用。例如,对ai输出内容,要留下水印。

-end-

编辑 | 向由

值班编辑 | 阿树

排版 | 起起

南风窗新媒体 出品

未经授权 禁止转载

关注南风窗,查看更多精彩内容