Sora讓好萊塢緊張!專家分析治理邏輯:可參考文生圖模型

近日,openai官網發布文生視頻模型sora,能根據文字指令創建逼真而富有想象力的場景,生成長達60秒的視頻,引發業內熱議。由於目前openai對模型現狀的信息發布並不完全,業內對其的討論依舊集中於其技術細節創新、對影視行業等相關領域的衝擊與影響等內容。南都記者注意到,目前發布的視頻案例畫面出現多處“穿幫”。

sora模型作為目前最為先進的文生視頻模型,是否存在已知的技術缺陷?文生視頻模型的技術革新是否會對現有人工智能(ai)行業的發展和治理造成顛覆性變革?對此,國內外專業人士仍認為,文生視頻模型的發展還處於“gpt3”時代,“還只是第一步”。有知識產權與科技安全領域專家向南都記者分析道,目前看來,文生視頻模型與文生圖模型的技術與治理邏輯仍然相似,或可通過紐約時報狀告openai侵權案後續發展進行前瞻。

sora模型發布案例視頻存在技術缺陷

南都此前報道,當地時間2月15日,openai官網發布文生視頻模型sora,能根據文字指令創建逼真而富有想象力的場景,生成長達60秒的視頻,引發業內熱議。

視頻demo截圖。

在sora的技術報告中,openai稱其為“作為世界模擬器的視頻生成模型”。openai稱,他們探索了在視頻數據上對生成模型進行大規模訓練的方法。目前其最大的模型sora能夠生成60秒的高清視頻。據外媒報道,與其他業界文生視頻模型相比,60秒是目前的最高紀錄,此前2023年ai生成視頻最長時長記錄為16秒。

在sora相關介紹頁面有48個視頻demo,並配有對應的提示詞。openai稱,該頁所有視頻均由sora直接生成,未經修改。

openai同時指出,當前的模型還存在弱點。它可能難以準確模擬複雜場景中的物理現象,也可能無法理解具體的因果關係,還可能混淆提示中的空間細節。在精確描述隨着時間推移而發生的事件方面,該模型也可能存在困難。

南都記者注意到,在其中一個被廣泛傳播的東京街頭視頻中,視頻主體——一名女子——在行走過程中左右腿曾突然交換位置,背景中,部分行人在面前有其他人或物品經過後消失。此外,其他視頻中也出現諸如一位老太太吹蠟燭但蠟燭卻並未熄滅,男子在跑步機上朝着反方向跑步等“穿幫”畫面。

目前,sora模型尚未面向公眾開放,openai正在與紅隊成員(red teamers)合作。紅隊成員是指在網絡安全領域受雇於組織或機構,模擬攻擊者進行滲透測試和安全評估的人員,他們將對sora模型進行對抗性測試。視覺藝術家、設計師和電影製片人等也被允許訪問sora並提供反饋意見。

據外媒報道,目前,人工智能視頻已經引發好萊塢轟動。一些技術專家從理論上推測,人工智能可以讓一個人製作出一部視覺複雜度與漫威大片相當的電影。多位電影工作者也公開表示,對自己的前途感到迷茫。美國企業家埃隆·馬斯克隨後也在社交平台回復有關sora模型發布的推文:gg humans(人類完蛋了)。

或可沿用文生圖模型的治理邏輯

南都此前報道,當地時間2023年12月27日,美國《紐約時報》對openai和微軟提起訴訟,指控這兩家企業未經授權使用該媒體數以百萬計文章訓練chatgpt等ai聊天機器人。

《紐約時報》稱,在某些情況下,openai和微軟將其刊登的內容逐字複製,提供給向ai聊天機器人尋求答案的用戶,這些新產品為新聞出版商創造了潛在競爭對手,而此種對媒體版權作品的使用方式是違法的。

《紐約時報》起訴微軟及openai公司侵權。

“該案或將帶來對美國現有版權法的重大變革,”國際關係學院知識產權與科技安全研究中心主任郝敏向南都記者分析道,與此同時,美國作為一個判例法國家,該案的判決結果對後續ai行業的同類性質產品——如文生視頻模型sora——的治理也會帶來“邏輯沿用”。

郝敏表示,未來各國在涉及ai行業知識產權法律相關內容上,將會形成“利益衡平”。“無論是《紐約時報》對其現有文字作品的保護,以及其要求openai使用其文字材料支付報酬,還是openai作為龍頭企業,考慮限制ai模型的訓練材料的做法對其自身和其他中小型相關企業的負面影響,都有一定道理。這是行業與行業間、利益集團與利益集團間的糾紛,最終將會是一個權衡利弊的結果”。

“目前法律界的核心觀點是‘工具論’,ai依舊是輔助人行動的一個‘工具’,”郝敏指出,“知識產權的主體必須是自然人,而不能是機器本身。”

而sora模型對現有影視行業的衝擊與影響,或也可從知識產權的視角進行前瞻。海內外多位行業專家提到,如果如sora等文生視頻模型對影視行業從業者的形象數據採集是一次性的、永久的,可能導致群眾演員職業成為一次性的數據採集工作。

“其實對於如明星代言等工作來說,衝擊也是類似的。明星的肖像數據採集可能將變成一次性工作。這就又落回到對數據算料的使用方式上了。對於享有知識產權的算料,是否屬於合理使用,是否需要徵得同意統一支付使用報酬?許多權益問題也會圍繞肖像權的使用展開討論。”郝敏告訴南都記者。

近日引發熱議的sora模型發布仍是一個開端。海內外多位行業專家指出,文生視頻模型的發展還處於“gpt3”時代,將在不斷彌補技術缺陷的同時,持續跟進治理與監管。

采寫:南都見習記者 肖玥 實習生 陳娜娜