2024新年伊始,一个新词火遍了影视圈、科技圈、资本圈——sora。北京时间2月16日,人工智能公司openai新推出了一款根据文字指令即时生成短视频的模型sora。此时,距该公司发布聊天机器人模型chatgpt才刚过去一年多。
在openai最新产品sora制作的演示视频中,一个戴着墨镜、身穿皮衣红裙的女人走在日本街头,她时不时回头张望,气质神秘。远处的霓虹街景、近处地面上积水的反光,特写镜头中女主人公的皮肤状态都清晰可见。
在传统的影视工业中,拍摄制作这样一段视频需要创作分镜脚本、选址勘景、服道化、打灯、拍摄、真人演绎、后期剪辑……但通过sora的应用,这一切只需要一句文字指令便可实现,这无疑让各行各业的人都感到兴奋。
360创始人周鸿祎在社交网络上发表看法称,“sora的诞生意味着agi(通用人工智能)的实现可能从10年缩短至一两年。”有人因此断言,sora将改变我们判断和认知世界的方式,从此“眼见不一定为实”“现实世界将不复存在”;大受震撼的影视人难免陷入“失业焦虑”与自我怀疑:“我们的岗位终将会被ai所取代吗?”还有人担忧,随着sora的推广应用,视频造假的门槛会大幅降低,一系列的道德伦理与法律监管问题将出现……
sora到底有多“神”?它会对影视、文娱行业带来怎样的利好或冲击?我们应该以怎样的心态去迎接ai时代的来临?南都记者近日走访了多位从业者,共同探讨了sora对影视文娱行业的影响。
1
sora强在哪?
能创建60秒时长视频的“世界模拟器”
sora这一名称源于日文“空”(そら sora),即天空之意,以示其无限的创造潜力。“这个东西想象力很大,我们作为从业者,心情很复杂。”虚拟影业联合创始人导演韦琪向记者感叹道。
根据官方介绍,sora可以根据用户的文本提示创建长达60秒的逼真视频,不仅呈现的影像画面精细、生动,更重要的是它可以了解物体在物理世界中的存在方式,从而深度模拟真实物理世界,生成具有多个角色、包含特定运动的复杂场景。因此,sora也有“世界模拟器”之称。
事实上在sora之前,已经有不少产品能够通过文字或者图片生成高清视频,比较知名的产品包括已经商用的runway,免费的pika,以及还在完善阶段的google lumiere、meta make-a-video等等。而与此前这些产品相比,sora的亮点与强项在哪儿?为何一出世就爆火刷屏社交网络?
sora推出的视频案例。
洲明集团副总裁刘俊在接受南都记者采访时总结了sora模型的三个特点。“第一是,它所能生成视频的时长比较长;第二是它的模拟能力很强,不仅能够模拟动态的视觉效果,还能够捕捉到深层次的、跟我们日常生活体验相一致的一些互动模式。举个例子,这次sora推出的那个‘女人走在大街上’的视频里,就连下了雨之后,路面上积水的反光(都很准确),包括这个女人的身高与整个空间结构的对比关系等等(都很准确)。所以它其实是能够模拟这种复杂的物理空间的。第三是在语音理解和视频生成方面,它有很长的文本的解析技术,能够根据用户的文本来分析。它还能够接受我们上传一些动态的图像,比如说我想在已有的视频上去做一些延伸,它补充的内容会接近你原有视频的风格。”
当然,根据官方介绍,sora也仍然存在一些“硬伤”。比如,由于其模型不是依靠内在的物理仿真引擎,而是依赖大规模数据驱动,因此在其生成的视频中,会出现不符合真实物理规律的地方,目前该问题尚难以根除。
2
或将取代传统工具与“工具人”,从业者“惊喜又焦虑”
sora在视频时长、成像质量、解析与模拟能力上都取得了巨大的突破。据国际数据公司预测,它将率先在短视频、广告、互动娱乐、影视制作等传媒领域得到应用。那么,横空出世的sora能够取代得了视频与影视工作者吗?哪些岗位的从业者会受到冲击,面临“失业危机”?业内人士在接受南都记者采访时表示,sora很有可能会取代传统cg工具及与其相关的低技术性岗位,在视频预演、基础剪辑、对现有素材的二次加工创作等方面,大幅提升生产效率与质量。
刘俊透露,洲明科技已获得微软独立软件开发商(isv)认证,并且获得了openai官方接入许可,但目前公司还没有测试过sora,仅可通过官方透露的信息来推测可能性。他表示:“第一感觉肯定是觉得 ai的进步很快,如果再给它足够的时间去完善的话,它是真的能够取代现在的一些创作工具和一些基础的‘工具人’所做的工作。比如说视频的预演,像在工业领域、医疗领域等,我们教学需要用的很多视频内容,你只要输入要求,sora就能够模拟出来。这样它就能替代大量的传统 cg相关的岗位,并且它输出的东西会更好。”
刘俊坦言,“一旦ai模型接触到大量的数据,它就能不断地学习、自我裂变,它的上限是不可估量的。我们对这个结果应该是感到很惊喜,但又会比较焦虑。惊喜是因为 ai它在某些领域的应用确实会非常节约人力,既快速又高效。”不仅大幅提高生产效率,sora也能降低生产门槛,让视频创作变得更普及和便利。但在另一方面,它也确实会对传统工具与低技术性岗位造成冲击,导致一部分人失业。
对于这种技术焦虑,虚拟影业联合创始人导演韦琪表示从业者应该不断学习,提升自我:“还是那句话,我们保持想象力,但是做好一切准备。肯定要保持不断地学习,如果只是老技术一直不革新,就算不是sora,是一个别的新技术,(我们)也迟早会被淘汰。”虚拟影业导演刘双建在接受南都记者采访时也展现了积极的态度:“ai既然是一个工具,自然会需要使用它的人。所以我们应该去思考的是,怎样去使用它,让它成为更好的一个创作工具。”
3
“ai只是辅助工具,替代不了创作人才”
在对sora的强大功能感到惊叹的同时,从业者们也清晰地认识到它作为一种辅助工具,在创作方面也存在局限。尤其是在影视作品、视频脚本的创新思维上,人类仍然具有不可替代性。
“ai只能去辅助大家创作,它是替代不了我们的创作人才的。”刘俊以电影《独行月球》的制作举例,“你可以让 ai生成‘一只袋鼠行走在一个太空舱里’的素材,但是袋鼠的形象具体是什么样子?多高?多壮?是可爱型的还是强健型的?它很难去设计一个具体的形象和风格。还是需要导演、美术等创作人员的创意想法,去勾勒出袋鼠的外廓形象,然后才能借助ai工具去生成。”
刘俊表示,ai拥有大量素材库,它的作用是帮助创作者在已有素材的基础上做二次编辑,但很难“无中生有”。“如果创作者是想找一些现有素材去做二次创作,ai就能够提高他的创作效率,它可以做创意的执行工作。但是创意的生成和创作思路,目前来说还是离不开我们人类的主观能动性。”
对于短视频而言,相比起后期的剪辑技术与视觉优化,一个新奇有趣的脚本创意、一个能击中广大受众情绪的idea才是创作的“灵魂”所在,这恰是sora所不具有的能力。而在体量更长、蕴含情感更复杂的影视剧创作面前,sora等文生视频工具则显得更“势单力薄”。除了产出剧本需要创意,完整故事线的铺陈、叙事节奏的把控、气氛的烘托、人物的塑造、情感的流露……这些复杂的工序,都是目前的ai技术远远无法实现的。刘俊提到:“电影和电视剧里有那么多场景和故事线,ai可能可以生成一段一段的素材,但目前还很难把整个影片去串起来,而且场景的风格调性也是随机的,不一定能够保持连贯性。”
当新概念的热潮退去,回归冷静和理性之后,从业者不得不回到对最本质问题的探讨——如何提升创作能力?如何讲好一个故事?无论是sora还是其他任何一种高新技术,目前都无法取代具有创新思维和深刻表达能力的创作者。
采写:南都记者 朱雯怡 余晓宇