“扔进一部小说、出来一部大片”的梦想从未如此接近现实。
近日,美国人工智能研究公司openai发布其首个文生视频模型sora,可用文字指令生成长达1分钟的高清视频,随即引起广泛关注和多方震动——通过sora生成的视频,画面流畅稳定,无抖动扭曲,物体特征连贯、不会突兀地改变,能保持多镜头的一致性,模拟自然世界的物理变动,且拥有3d运镜功能。
尽管其震撼全球的“60秒”也存在多处失误,但效果已让马斯克感叹“人类认赌服输”,许多人更是直呼“导演、后期要失业了”。毕竟,这一被称为“造片神器”的模型问世,意味着或许每个使用它的普通人都可能实现“导演梦”。很多人已经在畅想由chatgpt生成创意文案和脚本,再由sora从文本生成酷炫的几分钟广告大片。
sora的问世对视频行业影响几何?是否会带来“颠覆性影响”?影视制作从业者的工作是否会渐渐被其替代?日前,红星新闻对话了多位行业人士和学者。
sora一出,特效公司要死了?
从业者:“解放”影视后期有点难
sora一出,许多人认为,影视行业将首当其冲地受到影响,特别是其中的影视后期制作。
据第一财经报道,得知sora视频发布后,时光矩阵联合创始人郁刚称自己的心态“冰火两重天”:一方面,“特效公司要死了吗?”的第一反应,让他很想将过去学的特效工具“埋了”;但从另一个角度来说,他又很欣喜,觉得拍视频、做成特效并放到荧幕上这步最贵的动态预演环节,完全可以通过ai实现成本节省。
不过,对于郁刚的第二个观点,影视后期从业人员周先生却持保守乐观态度。他对红星新闻记者表示,靠sora来“解放”影视后期有点难:“因为人是社会的人,有很多创意和想法,而且要面对千千万万的需求。”
周先生倾向于认为,sora未来会成为辅助工具。同时他也质疑,生成的视频不像文字、图像生成作品,不便于人工完成“最后一公里”的再加工。
周先生进一步解释道,影视后期行业并不像很多人的刻板印象那样属于“机械化操作”,做设计只完成甲方的需求是不够的,还要引导甲方思维,加入自己的想法,“设计软件也好,sora也好,都只是工具;硬件和软件的进步都只是提高效率。”
“后期是一个很大的范围,涉及到拍摄、剪辑、包装、调色、三维,这些工作还能细分,程序要把这么庞大的知识理解清楚是很难的。”周先生说。
sora可产生“颠覆”性影响?
专家:属渐进性突破,许多环节难替代
事实上,文生视频大模型不是一条新赛道,openai也并非赛道唯一的拓荒者。2023年6月,谷歌支持的人工智能初创公司runway发布大模型gen-2,可生成几秒长的电影级影片;同年11月,动画视频生成公司pika推出了可以生成分钟级高质动画视频的产品。
尽管如此,sora可快速制作长达一分钟的高质量视频,一时间让“颠覆技术”“颠覆行业”成为业内热议的关键词。国盛证券日前发布的研报认为,sora相比此前其他文生视频模型,已经跨越到实用生产力工具,1分钟长度有望大规模应用在短视频领域,扩展视频的能力也有望制作长视频。
北京大学国家发展研究院助理研究员、bimba商学院副院长杜晓梦向红星新闻记者表示,跟此前的文生视频大模型pika和runway对比,sora确实在效果上有很大的提升,“这种突破主要体现在感官上,比之前要逼真很多,类似于chatgpt相比此前的一些人工智能语音助手的飞跃。”
但她同时指出,跟chatgpt对于文本的理解和生成的突破一样,sora是技术上的一个渐进性的突破,不是特别的革命性,没有改变生产力和生产关系的本质。
杜晓梦认为,这是一个工具性的、效率上的提升,不用一帧一帧地做了,但并不是说不需要人了。“即,会用这个工具的人,比不会用这个工具的人,可能效率要提升一些,(但本质上)还是人对人的替代,不是工具对人的替代。”
而替代不一定是唯一的结果。杜晓梦表示,效率的提升会带来两个选择:人员的压缩,或者扩大工作量。“如果你选择压缩成本,那你原来10个人干的活,现在2个人就可以干了。但我看到更多的情况是,因为用了这个工具,我可以接更多的工作了。所以我觉得,用这个工具的公司会pk掉那些不用这个工具的公司。”
此外,杜晓梦还指出,视频行业还有很多的环节不能被替代,比如创意。
知名编剧预测:
未来ai或可取代“七八十分的创作”
“这就是我们想要的。特别是对于我这样的文字工作者,可以从文字直接生成视频。”知名编剧汪海林在接受红星新闻记者采访时表示,在他看来,sora暂时不涉及对编剧的挑战,但对负责制作画面的导演和演员确实冲击较大。
对于横空出世的sora,汪海林大胆预计,将来人工智能将能替代90%的导演和摄制团队,以及他们70-80%的创意性、创造性并不多的那部分工作。“能取代的是那些能拿七八十分的创作,特别高的取代不了,特别低的则没有必要取代。”
尽管如此,在汪海林看来,人工摄制有其人文价值,可能更能体现出人的精神属性,就像机器制品占据市场后,依然有手工制品受到推崇。他猜想,未来完全由人工摄制的影视作品将变成一个受众狭窄的分众市场,就像每次只给几十个人看的小剧场话剧一样。
汪海林更喜欢用“辅助”而不是“替代”这个词。他认为,未来更有可能是人工智能和人工摄制结合,只是比例大小以及结合的好坏的问题,像cg技术早已经大量运用了。
汪海林认为,人工智能的运用可以大大提高效率,甚至会有一些意想不到的效果。行业不要排斥,但也不要完全依赖,放弃自己思考和创作的主动性,指望机器做到人也无法完成的内容。
对于编剧话语权是否会相对提升这一影视行业“苦久矣”的问题,汪海林则持谨慎态度,认为需要观察,因为权力结构的转变牵涉到的不仅仅是技术问题。
而话语权自然涉及到互联网平台企业。有分析认为,人工智能技术很大程度上来源于平台企业,平台企业也喜欢运用这种技术。但作为产业从业者,汪海林警惕的是,平台更倾向于用技术取代从业者,而不是辅助从业者,因为互联网在此前颠覆的行业中用的都是“b取代a”的模式,在影视行业也用此模式试错了多年。在汪海林看来,取代思维不一定能成功,融合才是正途。
在资深电影人、视频播客“开放对话”主播关雅荻看来,过去先进的数字化工具已经应用到做预算、做场景建设、做跨部门协作预演,大大提高了生产力,但“这次好像情况又不太一样”,目前来看sora的画质品质可以应用到院线级电影的过场戏的生成,替代拍摄和制作。
关雅荻对红星新闻记者表示,他认为电影行业的一线从业者还不会恐慌,因为电影核心的魅力其实是文化和情感的交流,这是人不可被替代的,至少现在的人工智能还没有这个能力。但在ai产生驱动世界的能力之前,人类和ai是可以协同共生的。
谁会是第一批“专业玩家”
业内预测:兼职自媒体人等或率先使用
sora目前定性为初期研究成果,不面向公众使用。openai公司表示因担心深度伪造视频的滥用问题,现在只有一部分视觉艺术家、设计师和电影制作人有内部试用机会。
那么,如果有一天sora“全面开放”,谁会是第一批“专业玩家”?
据杜晓梦了解,视频行业有一些人还是倾向于使用之前的工具和之前的方法论,就像一些程序员至今还在自己一行一行写代码。考虑到这种使用上的惯性,杜晓梦预计,一些之前没有接触过视频剪辑的人或业余者,反而可能会首先应用sora这类工具。
同时,杜晓梦指出,目前算力还很贵,文生视频暂时不会便宜,专业的公司会权衡性价比,所以用量没有那么大的小公司和业余者可能会首先应用起来,比如说兼职自媒体人——又能提升效率,对视频的要求又没有专业大公司那么高。“自媒体人可能会觉得sora让自己视频的效果更好,但专业的动画公司或影视公司可能还是觉得它不尽人意,就是个玩具。”
浙商证券发布的研报与杜晓梦的观点一致。该研报认为,短期内,sora及同类产品可大幅提升图像和短视频的制作效率,改变创意生产及营销工作流,提升短视频产品生产力。对于业态更加复杂的长视频和游戏,受限于模型还无法准确理解因果关系及其他技术难点,现阶段或以提供美术灵感支持为主。
中长期来看,浙商证券表示,sora及同类产品将参与到改变信息生产和分发两大环节的进程中,pgc(专业生产内容)将广泛采用ai工具辅助生产,ugc(用户生成内容)将借助ai工具逐步替代pgc。此间,ai生成视频工具的商业化将提速。
一名短视频从业者接受红星新闻采访时也认为,头部短视频创作者已经有庞大的专业团队,sora的作用目前来看就不是特别大,反而是腰部短视频创作者的文字能力、编导能力、视频呈现能力可能没有那么强,所以sora能成为一个有力的工具箱,做出高难度的画面,提高画面精美度、完整度。
“替代来得没那么快”
广泛落地不止是一个技术的问题
“sora可以说是又一个chatgpt时刻。”一位业内专家评价道。
作为一名编剧,汪海林坦言,编剧行业的确面临着chatgpt的挑战。事实上,去年美国好莱坞演员和编剧的超长大罢工便剑指人工智能。尤其是对于中低水平以下的编剧,他们抗议自己的单位劳动价值会被压低到极致。
但汪海林同时指出,chatgpt等新技术出现之后,很多创造性的工种都恐惧于自己的工作或被取代;但一段时间后,目前看来还没有那么快,被取代的往往是一些低层次、简单的劳动。“原来认为很快,但是几年过去之后,当时担心的一些情况并没有出现。”
一位影视制片人向红星新闻记者指出,cg技术的出现一度曾让影视行业恐慌,它也成为了视效大片的功臣,但大家发现其无法替代实拍效果,目前影视仍以实拍为主,只在无法实际呈现或出于节省经费考虑时才使用cg,更有导演崇尚完全实拍,不用cg。总体上他认为,对于制片人来说,sora的出现是好事。
以目前已出现的高质量图片生成引擎对美术行业的威胁为例,周先生也指出,目前美工的需求量依旧庞大,画师也并未失业,原画师还是有的,有一些二维动画师虽然失业了,但是“东边不亮西边亮”,三维效率更高,而且效果更好。
汪海林表示,技术问题从来都不止是单纯的技术问题,目前法律法规、行业配套的问题都还没有解决。而这也是杜晓梦认为的sora走向真正的商业化应用还需解决的问题——一个单一的技术需要一系列的技术的加持。
杜晓梦认为,目前看来,sora跟chatgpt一样能够落地有限的场景。在她看来,元宇宙模拟的场景很有希望,但这个场景能不能有比较大的发展,除了它本身之外,还取决于例如vr、mr相关技术,头显、眼镜等硬件技术的突破相配合,一个单一的技术是有制约的;如果相关的技术产生比较好的合力,除了元宇宙的场景,游戏、泛视频行业都会带来比较大的突破,包括广告、传媒、影视、自媒体。
红星新闻记者 胡伊文
编辑 李彬彬