被ChatGPT“复制”声音,“寡姐”斯嘉丽发文怒斥,OpenAI紧急停用,生成式AI面临深度伪造的新危机?

每经记者:文巧    每经编辑:兰素英

当地时间5月20日,外媒npr独家公布了被影迷称为“寡姐”、科幻电影《她》中ai助手饰演者斯嘉丽·约翰逊发布的一篇声明,斯嘉丽指控openai的chatgpt非法使用其声音,同时要求将语音下架。

上周,openai发布了最新旗舰模型gpt-4o,引爆科技圈。在发布会上,openai展示了chatgpt最新语音功能,不少人发现,其富有表现力的合成声音sky与《她》中斯嘉丽饰演的ai助手的声音惊人地相似,这引发了激烈的讨论。

斯嘉丽声明称,2023年9月,chatgpt推出语音模式时,openai曾找过她希望为其配音,但由于个人原因拒绝。就在gpt-4o演示前两天,openai还曾试图说服斯嘉丽,但在联系上之前,新模型就已发布。基于此,斯嘉丽的法律团队此前已向openai发送两封声明,要求该公司详细说明其开发这种声音的过程。

由于斯嘉丽的指控,openai在当地时间5月19日发表声明宣布暂停使用这款ai声音模板。同时,作为回应,该公司也公布了chatgpt中5个配音的详细创作流程,称这是从400多名专业配音和演员中挑选出来的。

实际上,这已经不是openai初次面临类似的指控。更早之前,《纽约时报》和《权力的游戏》原著作者乔治·马丁等在内的内容创作者都曾因版权问题将该公司告上法庭。而随着这场斗争延伸至语音领域,外媒wired认为,这可能会带来新的有关深度伪造的威胁。

“寡姐”斯嘉丽:chatgpt“偷”走我的声音

“当我听到发布演示时,我感到震惊、愤怒,并且不敢相信阿尔特曼会追求一种听起来与我如此相似的声音,以至于我最亲密的朋友和新闻媒体都无法分辨。”斯嘉丽在声明中这样写道。

图片来源:npr记者bobby allyn的x账号

实际上,自去年9月openai推出chatgpt的语音模式以来,sky的声音就一直可用。chatgpt的语音模式一共有breeze、cove、ember、juniper和sky五种声音。但直到上周openai演示了最新的旗舰ai模型gpt-4o模型,使声音更具表现力时,sky的声音与斯嘉丽的联系才变得清晰起来。

在上周的发布会上,openai展示了chatgpt最新语音功能,得益于反应速度的大幅提升,该功能几乎等同“实时对话”。随后,openai首席执行官阿尔特曼在x平台上发布了“her”这个词,暗示科幻电影《她》已走入现实。不少人意识到,chatgpt中富有表现力的合成声音与《她》斯嘉丽·约翰逊饰演的ai助手的声音惊人地相似,由此引发了外界激烈的讨论。

图片来源:x平台

而斯嘉丽的声明也指出,阿尔特曼用“她”来指代这部电影,似乎在鼓励全世界将chatgpt最新演示与其表演联系起来

她在声明中表示,2023年9月,chatgpt推出语音模式时,阿尔特曼找到她,询问她是否愿意为chatgpt配音,去安慰用户,弥合ai与人类之间巨大的差异所带来的不适感。斯嘉丽表示,经过深思熟虑后,她拒绝了这一提议。就在gpt-4o演示前两天,openai还曾试图说服斯嘉丽,但在联系上之前,新模型就已发布。基于此,斯嘉丽的法律团队此前已向openai发送两封声明,要求该公司详细说明其开发这种声音的过程。

openai回应:暂停sky语音,chatgpt的5种声音来自400多份投稿 

当地时间5月19日,openai表示公司正采取措施解决问题,同时正在暂停使用这款ai声音模板。

该公司还公布了chatgpt中5个配音的详细创作流程,称每一种声音都经过了长达五个月的精心挑选,且是从合作的配音演员中进行采样的,且每位演员的报酬都高于市场最高水平。

图片来源:openai官网

openai在声明中写道:“我们认为ai的声音不应该刻意模仿名人的独特声音——sky的声音不是对斯嘉丽·约翰逊的模仿,而是属于另一位专业女演员,使用她自己自然的说话声音。为了保护他们的隐私,我们不能分享我们配音演员的名字。”

据悉,2023年5月,openai的选角机构和选角导演发出了人才招募。不到一周,他们就收到了400多份配音演员和银幕演员的投稿。将近5个月后,他们挑选出了5种声音发布到chatgpt中。

该公司为chatgpt的声音制定了一套标准,仔细考虑了每个声音的独特个性及其对全球观众的吸引力。这些标准包括:有不同背景或能说多种语言的演员;一种听起来有“永恒”(timeless)感觉的声音;一种平易近人、能激发信任的声音;一种音色丰富,且温暖、引人入胜、充满自信、魅力十足的声音;自然且易于听取。

图片来源:openai官网

深度伪造威胁或升级

《每日经济新闻》记者注意到,斯嘉丽的指控已经不是openai初次面临类似的斗争。

今年5月初,包括《纽约每日新闻》和《芝加哥论坛报》在内的多家报纸在纽约联邦法院起诉openai和微软,指控他们滥用新闻内容来训练生成式ai系统。

去年12月,《纽约时报》在纽约南区法院向openai及其投资人微软公司提起侵犯版权诉讼;同月,多名普利策奖得主也起诉openai和微软滥用自己作品训练大模型,指出这样的行为无疑是在“刮取”作家们的作品和其他受版权保护的材料。

更早之前,去年9月,美国作家协会以及包括《权力的游戏》原著作者乔治·马丁在内的17位美国著名作家对openai发起集体诉讼,称openai在未经授权的情况下使用原告作家的版权作品训练其ai模型。

openai面临的难题也揭示了整个生成式ai领域与内容创作者之间权益边界的普遍性问题。

据媒体引用不完全统计数据称,自2022年11月至2023年10月,仅美国加州北区法院便已经受理了10起版权人起诉stabilityai、openai、meta、alphabet等公司未经授权,利用版权作品进行模型训练的案件。

外媒wired评论称,与斯嘉丽的冲突将加剧openai与艺术家、作家和其他创意人士之间的现有斗争。随着这场争斗蔓延至语音领域,wired认为,生成式ai使创建逼真的合成声音变得更加容易,这可能会带来新的有关深度伪造的威胁

实际上,openai今年3月就曾表示,它已经开发出一种可以从15秒的剪辑中克隆某人声音的技术,但该公司表示不会发布该技术,因为它可能会被滥用。

每日经济新闻