近日,openai官网发布文生视频模型sora,能根据文字指令创建逼真而富有想象力的场景,生成长达60秒的视频,引发业内热议。由于目前openai对模型现状的信息发布并不完全,业内对其的讨论依旧集中于其技术细节创新、对影视行业等相关领域的冲击与影响等内容。南都记者注意到,目前发布的视频案例画面出现多处“穿帮”。
sora模型作为目前最为先进的文生视频模型,是否存在已知的技术缺陷?文生视频模型的技术革新是否会对现有人工智能(ai)行业的发展和治理造成颠覆性变革?对此,国内外专业人士仍认为,文生视频模型的发展还处于“gpt3”时代,“还只是第一步”。有知识产权与科技安全领域专家向南都记者分析道,目前看来,文生视频模型与文生图模型的技术与治理逻辑仍然相似,或可通过纽约时报状告openai侵权案后续发展进行前瞻。
sora模型发布案例视频存在技术缺陷
南都此前报道,当地时间2月15日,openai官网发布文生视频模型sora,能根据文字指令创建逼真而富有想象力的场景,生成长达60秒的视频,引发业内热议。
视频demo截图。
在sora的技术报告中,openai称其为“作为世界模拟器的视频生成模型”。openai称,他们探索了在视频数据上对生成模型进行大规模训练的方法。目前其最大的模型sora能够生成60秒的高清视频。据外媒报道,与其他业界文生视频模型相比,60秒是目前的最高纪录,此前2023年ai生成视频最长时长记录为16秒。
在sora相关介绍页面有48个视频demo,并配有对应的提示词。openai称,该页所有视频均由sora直接生成,未经修改。
openai同时指出,当前的模型还存在弱点。它可能难以准确模拟复杂场景中的物理现象,也可能无法理解具体的因果关系,还可能混淆提示中的空间细节。在精确描述随着时间推移而发生的事件方面,该模型也可能存在困难。
南都记者注意到,在其中一个被广泛传播的东京街头视频中,视频主体——一名女子——在行走过程中左右腿曾突然交换位置,背景中,部分行人在面前有其他人或物品经过后消失。此外,其他视频中也出现诸如一位老太太吹蜡烛但蜡烛却并未熄灭,男子在跑步机上朝着反方向跑步等“穿帮”画面。
目前,sora模型尚未面向公众开放,openai正在与红队成员(red teamers)合作。红队成员是指在网络安全领域受雇于组织或机构,模拟攻击者进行渗透测试和安全评估的人员,他们将对sora模型进行对抗性测试。视觉艺术家、设计师和电影制片人等也被允许访问sora并提供反馈意见。
据外媒报道,目前,人工智能视频已经引发好莱坞轰动。一些技术专家从理论上推测,人工智能可以让一个人制作出一部视觉复杂度与漫威大片相当的电影。多位电影工作者也公开表示,对自己的前途感到迷茫。美国企业家埃隆·马斯克随后也在社交平台回复有关sora模型发布的推文:gg humans(人类完蛋了)。
或可沿用文生图模型的治理逻辑
南都此前报道,当地时间2023年12月27日,美国《纽约时报》对openai和微软提起诉讼,指控这两家企业未经授权使用该媒体数以百万计文章训练chatgpt等ai聊天机器人。
《纽约时报》称,在某些情况下,openai和微软将其刊登的内容逐字复制,提供给向ai聊天机器人寻求答案的用户,这些新产品为新闻出版商创造了潜在竞争对手,而此种对媒体版权作品的使用方式是违法的。
《纽约时报》起诉微软及openai公司侵权。
“该案或将带来对美国现有版权法的重大变革,”国际关系学院知识产权与科技安全研究中心主任郝敏向南都记者分析道,与此同时,美国作为一个判例法国家,该案的判决结果对后续ai行业的同类性质产品——如文生视频模型sora——的治理也会带来“逻辑沿用”。
郝敏表示,未来各国在涉及ai行业知识产权法律相关内容上,将会形成“利益衡平”。“无论是《纽约时报》对其现有文字作品的保护,以及其要求openai使用其文字材料支付报酬,还是openai作为龙头企业,考虑限制ai模型的训练材料的做法对其自身和其他中小型相关企业的负面影响,都有一定道理。这是行业与行业间、利益集团与利益集团间的纠纷,最终将会是一个权衡利弊的结果”。
“目前法律界的核心观点是‘工具论’,ai依旧是辅助人行动的一个‘工具’,”郝敏指出,“知识产权的主体必须是自然人,而不能是机器本身。”
而sora模型对现有影视行业的冲击与影响,或也可从知识产权的视角进行前瞻。海内外多位行业专家提到,如果如sora等文生视频模型对影视行业从业者的形象数据采集是一次性的、永久的,可能导致群众演员职业成为一次性的数据采集工作。
“其实对于如明星代言等工作来说,冲击也是类似的。明星的肖像数据采集可能将变成一次性工作。这就又落回到对数据算料的使用方式上了。对于享有知识产权的算料,是否属于合理使用,是否需要征得同意统一支付使用报酬?许多权益问题也会围绕肖像权的使用展开讨论。”郝敏告诉南都记者。
近日引发热议的sora模型发布仍是一个开端。海内外多位行业专家指出,文生视频模型的发展还处于“gpt3”时代,将在不断弥补技术缺陷的同时,持续跟进治理与监管。
采写:南都见习记者 肖玥 实习生 陈娜娜