OpenAI向左,Meta往右

圖片來源@視覺中國

文 | 定焦,作者 | 黎明,編輯 | 魏佳

openai正變得越來越封閉,但它的對手meta(前facebook),卻通過開源贏得不少讚譽。

1月18日,馬克·扎克伯格宣布,meta正在計劃構建自己的agi(通用人工智能),將在絕大多數領域中都達到或超越人類智能水平。同時他強調,保證會向大眾開放這一技術,以便人人都能從中獲益。

與openai拒絕open他們的算法、路線、論文相反,meta選擇open到底。此前震驚業內的大模型llama,大獲好評的llama 2,以及正在研發的llama 3,都是開源的。它們成為很多ai公司研究、學習甚至抄襲的對象。

通過開源這一手段,meta在某種程度上打破了大模型的壟斷,成為openai和谷歌雙雄相爭之外的第三股力量。一些人將扎克伯格視為大模型時代的英雄,有人在扎克伯格的帖子下留言,建議meta更名為openai,openai更名為closeai。

事實上,meta過去開源了它研發的幾乎所有基礎設施,比如用於web和app開發框架的react,以及機器學習框架pytorch,而chatgpt就是基於pytorch開發的,openai也運行在pytorch上。按照meta首席科學家楊立昆的話說,除谷歌外,全世界都運行在pytorch上,因為谷歌有自己的系統。

只是,這些東西在過去都被meta的負面新聞掩蓋了——干預選舉進程、提供虛假信息、危害青少年健康,在硅谷,罵facebook曾是一種「政治正確」, 人們認為這是一家價值觀敗壞的公司。

如今風評大變,meta一時彷彿成了整個ai圈的希望,它的股價在2023年上漲了160%,在美國前五大科技巨頭中漲幅僅次於英偉達,最近重返萬億美元市值,股價創新高。而曾以挑戰者姿態崛起的openai,前不久剛經歷了一場宮斗,散發出越來越濃的銅臭味。

openai向左,meta往右,兩家原本沒有太多交集的公司,正走出截然不同的路。

openai,走向封閉

在討論這兩家公司的境況之前,我們先把時間拉回到十年前。

2013年,有一家叫deepmind的ai公司,同時引起了谷歌和facebook(當時還沒更名為meta)的注意。

當時這家公司剛嶄露頭角,嗅覺敏銳的谷歌和facebook都想收購它。最終,谷歌在競購中勝出,2014年1月將deepmind收入囊中。三年後,deepmind開發的ai機械人alphago,以4:1擊敗了韓國圍棋冠軍李世石,一舉成名。

谷歌收購deepmind時,有兩個人心裏很不是滋味。一個是扎克伯格,他當時已經意識到ai的巨大前景;另一個是馬斯克,他不想ai被谷歌這樣的大公司控制。

於是,扎克伯格決定自己做,他花重金從紐約大學請來了計算機科學領域的權威人物楊立昆,啟動fair項目,在facebook成立了ai實驗室。馬斯克則和奧爾特曼成立了openai,用來對抗谷歌。

從當時的情形來看,扎克伯格是為了自己的公司,馬斯克是為了全人類。馬斯克認為,由大公司控制的少量ai系統很不安全,唯一的辦法是讓儘可能多的人都擁有ai。所以openai一開始就定位開源,是一個非營利性的機構。

馬斯克當時說:「我們希望有一種類似於linux版本的ai,不受任何個人或公司的控制。」

一個為私,一個為公,兩家公司一開始就選了不同的路。

馬斯克提到的linux,是一款免費開源的操作系統。在互聯網早期,計算機剛開始普及時,可用的操作系統不多,要麼源代碼被軟件廠商嚴格保密,要麼收取很高昂的費用。一個歐洲大學生開發出linux操作系統的雛形,然後免費對外公開了自己的代碼。

由於開源,全球程序員都加入進來改進代碼,最終創造了linux操作系統,且使用完全免費。這大大加速了計算機的普及。我們今天熟知的安卓系統,就是基於linux內核,全球大部分手機都跑在這個系統上。

馬斯克的想法很簡單,ai時代也需要有這樣一個開源開放的操作系統,市場不能讓巨頭獨佔。

openai的啟動資金來源於一批科技大佬捐贈,它一開始的確是按開源的路徑走的,2019年發佈的gpt-2,就是一個開源大模型,當年還有人用gpt-2為《權利的遊戲》改寫劇本結尾。

但也是在gpt-2發佈之後,openai逐漸走向封閉。它隨後成立營利性子公司,接受了微軟的數十億美元投資。

在那之後,2020年發佈的gpt-3,2022年升級的gpt-3.5,以及2023年3月發佈的gpt-4,都是閉源模型,一開始openai還公布論文,到後來連模型具體參數都不再公布。

而從整個大模型行業的競爭格局來看,「openai-微軟」「deepmind-谷歌」的雙巨頭組合格局正式形成。

馬斯克對此非常不滿。他說,openai設立時是一家開源公司,現在變成了一個閉源、受微軟控制的逐利公司。這根本不是他想要的。

這期間meta沒閑着。除了折騰元宇宙,meta的ai團隊一直在研究大語言模型,並發佈了一些開源項目。大家各做各的,互不干涉。

在openai發佈chatgpt的幾周前,meta發佈了一個類似的聊天機械人galactica,專門用於撰寫科學論文。誰知道這個產品不僅沒引起轟動,還招來一片罵聲,網友痛斥它會破壞科學出版。以至於meta的人取消了演示,覺都睡不着。

當時人們關心的是meta的元宇宙項目是不是快涼了,裁員裁到哪了,沒人關心它的ai做得咋樣。至於openai,大家覺得它代表新勢力,對它更加包容。

按照楊立昆的說法,兩周後chatgpt問世,被視為救世主降臨。隨後的很長時間裏,openai都是全球科技界的當紅炸子雞,登上神壇奪走了所有目光。人們津津樂道於,openai是如何衝破谷歌的封鎖,對巨頭形成壓制。

在崇尚個人英雄主義的美國,創業新秀挑戰舊勢力的劇本,向來充滿話題性。於是大模型頭部選手的競爭,變成了openai和谷歌的雙雄爭霸。

但一向好強的扎克伯格不會袖手旁觀。meta秘密研發的llama大模型,已經箭在弦上。

meta才是全村的希望?

2023年2月,chatgpt發佈之後3個月,llama的第一個版本開源,一開始這個模型只能用作研究。7月,升級之後的llama 2支持免費商用。meta把模型訓練數據、訓練方法、數據標註等大量細節都公布了,起始代碼全部開源。

llama 2性能非常突出,超過了所有的開源大模型。有人發現,其最大參數的版本比gpt-3參數量小,但效果更好。

曾經跟着馬斯克從openai跳到特斯拉,後來又被openai挖回去的科學家andrej karpathy,將llama 2的發佈視為人工智能和大模型發展過程中的重要一天,因為這「是任何人都可以拿到模型權重的最強大語言模型。」

一時間,整個ai圈對meta刮目相看。當一批巨頭公司掀起大模型軍備競賽,試圖通過技術封閉實現市場壟斷時,meta用llama撕開了一條口子。openai沒做的事,meta做到了。

英諾天使基金合伙人王晟戲稱楊立昆為「klaus lecun」( 楊立昆英文名為yann lecun,klaus fuchs在二戰期間向蘇聯提供了曼哈頓計劃的信息)。王晟開玩笑:「不能只讓美國擁有原子彈。」

王晟發現,chatgpt出現之後,科技圈對大模型熱情且迷茫。投資人中很多是看熱鬧,「因為第一看不懂,第二不敢投,第三投不到。一個新的技術範式出現,沒人知道它的能力邊界在哪裡。」

王晟對「定焦」說,llama開源對行業影響很大。「meta過去這些年積累的大模型技術,本來都是不傳之秘,結果一開源,迅速把很多認知拉平了。」

之前,國內團隊研發大模型,只能從零到一不斷試錯,一旦有個點被卡住了,即便從技術角度來說並不是太難,但靠自己可能也需要花一兩年時間才能解決,需要親自踩很多坑。現在meta直接把它的經驗和數據拿出來,在思路和方法上給了行業非常重要的指引。

在這個過程中大家學習了很多。假如沒有llama開源,國內大模型今天的水平可能會差很多,我們會大幅度被人甩下。」王晟說。

這也是為什麼國內一下子突然湧現出200多個大模型。王小川的百川智能在公司成立僅兩個月就發佈了一款大模型,其實就是借鑒了llama。李開復的零一萬物推出的大模型,也是使用llama的開源模型架構。

llama開源對openai最直觀的影響,是有一堆中國公司跳出來「吊打」gpt。在他們的口徑中,已經在多項指標上超過了gpt模型,雖然很多榜單都是刷出來的。

更深層次的影響在於,大模型開源社區的力量快速壯大,全球的程序員都能為開源做貢獻。他們開發出各種開源數據集,迭代出更多新模型,縮小與閉源大模型的差距。所以谷歌的工程師說,谷歌沒有護城河,openai也沒有。

meta在科技圈的形象變得高大起來。回顧meta的發展,其實它一直都有開源的傳統。

早在2016年,meta團隊就開發並開源了深度學習框架pytorch,它和谷歌的tensorflow成為深度學習領域的兩大主流框架。

跟openai現在才開始秘密推進芯片製造項目不同,meta在三年前就設計了自研ai推理芯片,並採用了開源架構。

在語言翻譯方面它推出了很多開源模型,兩年前發佈的nllb模型是維基百科的翻譯供應商之一,2023年發佈的seamlessm4t可以翻譯近百種語言,同時它還發佈了全球最大的開放多模態翻譯數據集。

有研究人員經過對比認為,meta更傾向於信任、問責制以及通過開源實現人工智能的民主化。

反觀openai,它依然在技術上保持領先,但拒絕開放。

「沒人知道openai進展到什麼程度了,包括它正在研發的gpt-5,是不是繼續用的transformer都是未知數。現在大家都跟着gpt-3.5的技術路線在跑,假設它悄悄變換了方向,那大家就掉坑裡了。因為沒人知道正確路線是什麼。」一位ai公司的創始人說。

同時它試圖阻擋競爭對手,以保持自己的先發優勢。

位元組跳動在2023年12月被openai停用賬戶,因為它在調用openai的api開發自身大語言模型的時候,違反了openai的服務條款。有悖商業倫理的行為肯定是不對的,但外界由此關注到openai的商業條款,它禁止客戶使用gpt輸出的內容開發任何可能會給openai帶來競爭的ai模型。

值得注意的是,微軟也有類似條款。它們將商業上的競爭優勢看得很重要。

人工智能公司開放傳神(opencsg)創始人、ceo陳冉認為,開源的市場空間遠比閉源大,但未來一定是開源和閉源兩條路同時走,「openai開源不開源其實不重要了。」

開源閉源,誰對誰錯?

究竟是openai被利益蒙蔽了雙眼,還是meta大公無私要為全人類做貢獻?

或許,它們在本質上並無不同。openai既沒有那麼自私,meta也不像網友鼓吹的那樣高尚,區別只在於路線和策略。

若論對整個ai行業的貢獻,openai毫無疑問是最大的。畢竟,這一輪ai浪潮是由chatgpt掀起的。它點燃了一把火,加速了大模型的普及。事實上,前兩年大模型開源社區基本是圍着gpt-3在轉。

openai不像谷歌、meta那些巨頭擁有雄厚的資金積累,早年大佬捐贈的資金早花得差不多了,沒錢是做不了研發的,總不能用愛發電。所以openai抱了微軟的大腿,奧爾特曼想盡辦法為openai賺錢。

陳冉認為,openai的成功其實是商業模式的成功,本質是投資人看到了巨大的商業價值和盈利模式。開源與閉源之間的競爭方向一定是掙錢模式的創新競爭。

meta將技術開源,也不是只為他人做嫁衣。開源是一種策略,能吸引更多開發人員免費幫它迭代技術、修復漏洞,正所謂眾人拾柴火焰高,但最核心的技術還是掌握在meta手裡,該打擊對手的時候它不會手軟。就像谷歌,它旗下的安卓是開源系統,但國內手機廠商做自己的系統還是會有很多限制。

而在大模型火起來之前,meta掉進了元宇宙的深坑裡無法自拔,砸錢、虧損、裁員,看不到任何希望。大模型是那根救命稻草,chatgpt則是照亮前路的那束光。

再往深了看,閉源的openai和開源的meta,從根本上對ai的價值判斷有分歧。

如果將ai比作未來世界的核武器,openai認為它很危險,得謹慎,不能濫用。meta則認為,核武器不能只掌握在少數幾個玩家手裡,應該開放研究。

關於ai的利弊之辯,是科技圈的一個老話題。馬斯克就相信「ai危險論」,他擔心有一天機器的智力、意識都超過了人類,可能會取代人類,摧毀人類文明。所以他當年牽頭成立openai,只是後來openai沒按他設想的路徑走。

基於「防止ai取代人類」的願景,行業里又延伸出兩大派別。一派認為大量獨立的ai系統比由大公司控制的少量ai系統更安全,ai的研究應該開源開放;另一派認為應該封閉研究,這可以減輕安全風險,防止不法分子濫用獲得的代碼。

openai屬於後者。支持它的人認為開源策略加大了風險,比如倫敦一家ai公司的ceo就認為,meta是最不負責任的人工智能參與者,他問:「我們應該令核武器的設計透明化嗎?」

meta將開源視為最優策略,楊立昆就認為,機器最終會比人類更聰明,人類無法阻止壞人獲取它,ai必須是開源的,只有讓更多人參與其中,最終開發出的系統才會更安全。他認為馬斯克的ai威脅論就是科幻小說看多了。

楊立昆曾經的合作夥伴,跟他一塊獲得圖靈獎的傑弗里·辛頓,則持有不同觀點,認為ai將對人類構成嚴重威脅。他的思想也許對他的學生伊利亞造成了影響。伊利亞是openai的聯合創始人兼首席科學家,幾乎決定了openai的技術路線,他也是openai宮斗事件中開除奧爾特曼的關鍵人物。伊利亞一直致力於追求安全可靠的agi。業內普遍認為,商業化和agi的路線之爭,引發了那場衝突。

所以,openai和meta有不同的信念。openai將agi視為終極目標,並且相信自己將會第一個實現它;meta將開放平台視為最好的路徑,試圖制定開源標準。當然,它們都希望在這個過程里拿到應得的商業利益。

往長遠看,ai的發展是螺旋式上升的,開源也好,閉源也罷,都將為其注入動能。究竟誰是真的在為全人類的未來操心,只有等待時間檢驗了。