OpenAI向左，Meta往右

2024-01-26 10:30:56 娛樂頭條 9422℃

圖片來源@視覺中國

文 | 定焦，作者 | 黎明，編輯 | 魏佳

openai正變得越來越封閉，但它的對手meta（前facebook），卻通過開源贏得不少讚譽。

1月18日，馬克·扎克伯格宣布，meta正在計劃構建自己的agi（通用人工智能），將在絕大多數領域中都達到或超越人類智能水平。同時他強調，保證會向大眾開放這一技術，以便人人都能從中獲益。

與openai拒絕open他們的算法、路線、論文相反，meta選擇open到底。此前震驚業內的大模型llama，大獲好評的llama 2，以及正在研發的llama 3，都是開源的。它們成為很多ai公司研究、學習甚至抄襲的對象。

通過開源這一手段，meta在某種程度上打破了大模型的壟斷，成為openai和谷歌雙雄相爭之外的第三股力量。一些人將扎克伯格視為大模型時代的英雄，有人在扎克伯格的帖子下留言，建議meta更名為openai，openai更名為closeai。

事實上，meta過去開源了它研發的幾乎所有基礎設施，比如用於web和app開發框架的react，以及機器學習框架pytorch，而chatgpt就是基於pytorch開發的，openai也運行在pytorch上。按照meta首席科學家楊立昆的話說，除谷歌外，全世界都運行在pytorch上，因為谷歌有自己的系統。

只是，這些東西在過去都被meta的負面新聞掩蓋了——干預選舉進程、提供虛假信息、危害青少年健康，在硅谷，罵facebook曾是一種「政治正確」，人們認為這是一家價值觀敗壞的公司。

如今風評大變，meta一時彷彿成了整個ai圈的希望，它的股價在2023年上漲了160%，在美國前五大科技巨頭中漲幅僅次於英偉達，最近重返萬億美元市值，股價創新高。而曾以挑戰者姿態崛起的openai，前不久剛經歷了一場宮斗，散發出越來越濃的銅臭味。

openai向左，meta往右，兩家原本沒有太多交集的公司，正走出截然不同的路。

openai，走向封閉

在討論這兩家公司的境況之前，我們先把時間拉回到十年前。

2013年，有一家叫deepmind的ai公司，同時引起了谷歌和facebook（當時還沒更名為meta）的注意。

當時這家公司剛嶄露頭角，嗅覺敏銳的谷歌和facebook都想收購它。最終，谷歌在競購中勝出，2014年1月將deepmind收入囊中。三年後，deepmind開發的ai機械人alphago，以4：1擊敗了韓國圍棋冠軍李世石，一舉成名。

谷歌收購deepmind時，有兩個人心裏很不是滋味。一個是扎克伯格，他當時已經意識到ai的巨大前景；另一個是馬斯克，他不想ai被谷歌這樣的大公司控制。

於是，扎克伯格決定自己做，他花重金從紐約大學請來了計算機科學領域的權威人物楊立昆，啟動fair項目，在facebook成立了ai實驗室。馬斯克則和奧爾特曼成立了openai，用來對抗谷歌。

從當時的情形來看，扎克伯格是為了自己的公司，馬斯克是為了全人類。馬斯克認為，由大公司控制的少量ai系統很不安全，唯一的辦法是讓儘可能多的人都擁有ai。所以openai一開始就定位開源，是一個非營利性的機構。

馬斯克當時說：「我們希望有一種類似於linux版本的ai，不受任何個人或公司的控制。」

一個為私，一個為公，兩家公司一開始就選了不同的路。

馬斯克提到的linux，是一款免費開源的操作系統。在互聯網早期，計算機剛開始普及時，可用的操作系統不多，要麼源代碼被軟件廠商嚴格保密，要麼收取很高昂的費用。一個歐洲大學生開發出linux操作系統的雛形，然後免費對外公開了自己的代碼。

由於開源，全球程序員都加入進來改進代碼，最終創造了linux操作系統，且使用完全免費。這大大加速了計算機的普及。我們今天熟知的安卓系統，就是基於linux內核，全球大部分手機都跑在這個系統上。

馬斯克的想法很簡單，ai時代也需要有這樣一個開源開放的操作系統，市場不能讓巨頭獨佔。

openai的啟動資金來源於一批科技大佬捐贈，它一開始的確是按開源的路徑走的，2019年發佈的gpt-2，就是一個開源大模型，當年還有人用gpt-2為《權利的遊戲》改寫劇本結尾。

但也是在gpt-2發佈之後，openai逐漸走向封閉。它隨後成立營利性子公司，接受了微軟的數十億美元投資。

在那之後，2020年發佈的gpt-3，2022年升級的gpt-3.5，以及2023年3月發佈的gpt-4，都是閉源模型，一開始openai還公布論文，到後來連模型具體參數都不再公布。

而從整個大模型行業的競爭格局來看，「openai-微軟」「deepmind-谷歌」的雙巨頭組合格局正式形成。

馬斯克對此非常不滿。他說，openai設立時是一家開源公司，現在變成了一個閉源、受微軟控制的逐利公司。這根本不是他想要的。

這期間meta沒閑着。除了折騰元宇宙，meta的ai團隊一直在研究大語言模型，並發佈了一些開源項目。大家各做各的，互不干涉。

在openai發佈chatgpt的幾周前，meta發佈了一個類似的聊天機械人galactica，專門用於撰寫科學論文。誰知道這個產品不僅沒引起轟動，還招來一片罵聲，網友痛斥它會破壞科學出版。以至於meta的人取消了演示，覺都睡不着。

當時人們關心的是meta的元宇宙項目是不是快涼了，裁員裁到哪了，沒人關心它的ai做得咋樣。至於openai，大家覺得它代表新勢力，對它更加包容。

按照楊立昆的說法，兩周後chatgpt問世，被視為救世主降臨。隨後的很長時間裏，openai都是全球科技界的當紅炸子雞，登上神壇奪走了所有目光。人們津津樂道於，openai是如何衝破谷歌的封鎖，對巨頭形成壓制。

在崇尚個人英雄主義的美國，創業新秀挑戰舊勢力的劇本，向來充滿話題性。於是大模型頭部選手的競爭，變成了openai和谷歌的雙雄爭霸。

但一向好強的扎克伯格不會袖手旁觀。meta秘密研發的llama大模型，已經箭在弦上。

meta才是全村的希望？

2023年2月，chatgpt發佈之後3個月，llama的第一個版本開源，一開始這個模型只能用作研究。7月，升級之後的llama 2支持免費商用。meta把模型訓練數據、訓練方法、數據標註等大量細節都公布了，起始代碼全部開源。

llama 2性能非常突出，超過了所有的開源大模型。有人發現，其最大參數的版本比gpt-3參數量小，但效果更好。

曾經跟着馬斯克從openai跳到特斯拉，後來又被openai挖回去的科學家andrej karpathy，將llama 2的發佈視為人工智能和大模型發展過程中的重要一天，因為這「是任何人都可以拿到模型權重的最強大語言模型。」

一時間，整個ai圈對meta刮目相看。當一批巨頭公司掀起大模型軍備競賽，試圖通過技術封閉實現市場壟斷時，meta用llama撕開了一條口子。openai沒做的事，meta做到了。

英諾天使基金合伙人王晟戲稱楊立昆為「klaus lecun」（楊立昆英文名為yann lecun，klaus fuchs在二戰期間向蘇聯提供了曼哈頓計劃的信息）。王晟開玩笑：「不能只讓美國擁有原子彈。」

王晟發現，chatgpt出現之後，科技圈對大模型熱情且迷茫。投資人中很多是看熱鬧，「因為第一看不懂，第二不敢投，第三投不到。一個新的技術範式出現，沒人知道它的能力邊界在哪裡。」

王晟對「定焦」說，llama開源對行業影響很大。「meta過去這些年積累的大模型技術，本來都是不傳之秘，結果一開源，迅速把很多認知拉平了。」

之前，國內團隊研發大模型，只能從零到一不斷試錯，一旦有個點被卡住了，即便從技術角度來說並不是太難，但靠自己可能也需要花一兩年時間才能解決，需要親自踩很多坑。現在meta直接把它的經驗和數據拿出來，在思路和方法上給了行業非常重要的指引。

「在這個過程中大家學習了很多。假如沒有llama開源，國內大模型今天的水平可能會差很多，我們會大幅度被人甩下。」王晟說。

這也是為什麼國內一下子突然湧現出200多個大模型。王小川的百川智能在公司成立僅兩個月就發佈了一款大模型，其實就是借鑒了llama。李開復的零一萬物推出的大模型，也是使用llama的開源模型架構。

llama開源對openai最直觀的影響，是有一堆中國公司跳出來「吊打」gpt。在他們的口徑中，已經在多項指標上超過了gpt模型，雖然很多榜單都是刷出來的。

更深層次的影響在於，大模型開源社區的力量快速壯大，全球的程序員都能為開源做貢獻。他們開發出各種開源數據集，迭代出更多新模型，縮小與閉源大模型的差距。所以谷歌的工程師說，谷歌沒有護城河，openai也沒有。

meta在科技圈的形象變得高大起來。回顧meta的發展，其實它一直都有開源的傳統。

早在2016年，meta團隊就開發並開源了深度學習框架pytorch，它和谷歌的tensorflow成為深度學習領域的兩大主流框架。

跟openai現在才開始秘密推進芯片製造項目不同，meta在三年前就設計了自研ai推理芯片，並採用了開源架構。

在語言翻譯方面它推出了很多開源模型，兩年前發佈的nllb模型是維基百科的翻譯供應商之一，2023年發佈的seamlessm4t可以翻譯近百種語言，同時它還發佈了全球最大的開放多模態翻譯數據集。

有研究人員經過對比認為，meta更傾向於信任、問責制以及通過開源實現人工智能的民主化。

反觀openai，它依然在技術上保持領先，但拒絕開放。

「沒人知道openai進展到什麼程度了，包括它正在研發的gpt-5，是不是繼續用的transformer都是未知數。現在大家都跟着gpt-3.5的技術路線在跑，假設它悄悄變換了方向，那大家就掉坑裡了。因為沒人知道正確路線是什麼。」一位ai公司的創始人說。

同時它試圖阻擋競爭對手，以保持自己的先發優勢。

位元組跳動在2023年12月被openai停用賬戶，因為它在調用openai的api開發自身大語言模型的時候，違反了openai的服務條款。有悖商業倫理的行為肯定是不對的，但外界由此關注到openai的商業條款，它禁止客戶使用gpt輸出的內容開發任何可能會給openai帶來競爭的ai模型。

值得注意的是，微軟也有類似條款。它們將商業上的競爭優勢看得很重要。

人工智能公司開放傳神（opencsg）創始人、ceo陳冉認為，開源的市場空間遠比閉源大，但未來一定是開源和閉源兩條路同時走，「openai開源不開源其實不重要了。」

開源閉源，誰對誰錯？

究竟是openai被利益蒙蔽了雙眼，還是meta大公無私要為全人類做貢獻？

或許，它們在本質上並無不同。openai既沒有那麼自私，meta也不像網友鼓吹的那樣高尚，區別只在於路線和策略。

若論對整個ai行業的貢獻，openai毫無疑問是最大的。畢竟，這一輪ai浪潮是由chatgpt掀起的。它點燃了一把火，加速了大模型的普及。事實上，前兩年大模型開源社區基本是圍着gpt-3在轉。

openai不像谷歌、meta那些巨頭擁有雄厚的資金積累，早年大佬捐贈的資金早花得差不多了，沒錢是做不了研發的，總不能用愛發電。所以openai抱了微軟的大腿，奧爾特曼想盡辦法為openai賺錢。

陳冉認為，openai的成功其實是商業模式的成功，本質是投資人看到了巨大的商業價值和盈利模式。開源與閉源之間的競爭方向一定是掙錢模式的創新競爭。

meta將技術開源，也不是只為他人做嫁衣。開源是一種策略，能吸引更多開發人員免費幫它迭代技術、修復漏洞，正所謂眾人拾柴火焰高，但最核心的技術還是掌握在meta手裡，該打擊對手的時候它不會手軟。就像谷歌，它旗下的安卓是開源系統，但國內手機廠商做自己的系統還是會有很多限制。

而在大模型火起來之前，meta掉進了元宇宙的深坑裡無法自拔，砸錢、虧損、裁員，看不到任何希望。大模型是那根救命稻草，chatgpt則是照亮前路的那束光。

再往深了看，閉源的openai和開源的meta，從根本上對ai的價值判斷有分歧。

如果將ai比作未來世界的核武器，openai認為它很危險，得謹慎，不能濫用。meta則認為，核武器不能只掌握在少數幾個玩家手裡，應該開放研究。

關於ai的利弊之辯，是科技圈的一個老話題。馬斯克就相信「ai危險論」，他擔心有一天機器的智力、意識都超過了人類，可能會取代人類，摧毀人類文明。所以他當年牽頭成立openai，只是後來openai沒按他設想的路徑走。

基於「防止ai取代人類」的願景，行業里又延伸出兩大派別。一派認為大量獨立的ai系統比由大公司控制的少量ai系統更安全，ai的研究應該開源開放；另一派認為應該封閉研究，這可以減輕安全風險，防止不法分子濫用獲得的代碼。

openai屬於後者。支持它的人認為開源策略加大了風險，比如倫敦一家ai公司的ceo就認為，meta是最不負責任的人工智能參與者，他問：「我們應該令核武器的設計透明化嗎？」

meta將開源視為最優策略，楊立昆就認為，機器最終會比人類更聰明，人類無法阻止壞人獲取它，ai必須是開源的，只有讓更多人參與其中，最終開發出的系統才會更安全。他認為馬斯克的ai威脅論就是科幻小說看多了。

楊立昆曾經的合作夥伴，跟他一塊獲得圖靈獎的傑弗里·辛頓，則持有不同觀點，認為ai將對人類構成嚴重威脅。他的思想也許對他的學生伊利亞造成了影響。伊利亞是openai的聯合創始人兼首席科學家，幾乎決定了openai的技術路線，他也是openai宮斗事件中開除奧爾特曼的關鍵人物。伊利亞一直致力於追求安全可靠的agi。業內普遍認為，商業化和agi的路線之爭，引發了那場衝突。

所以，openai和meta有不同的信念。openai將agi視為終極目標，並且相信自己將會第一個實現它；meta將開放平台視為最好的路徑，試圖制定開源標準。當然，它們都希望在這個過程里拿到應得的商業利益。

往長遠看，ai的發展是螺旋式上升的，開源也好，閉源也罷，都將為其注入動能。究竟誰是真的在為全人類的未來操心，只有等待時間檢驗了。

標籤：娛樂頭條

上一篇：不走了！繼續為大連而戰，閻相闖有望加盟大連智行隊

下一篇：微信出手音頻娛樂：既是被逼的，也是主動的