“AI界春晚”2024北京智源大會：新主角、共識和分歧

2024-06-18 01:30:16 娛樂頭條 4974℃

每經記者：可楊每經編輯：張海妮

結束圓桌對談後，人牆迅速圍攏，以月之暗面ceo楊植麟為核心，把會場前排的空白處填補得嚴嚴實實，人們舉着手機，寄望於伸出的胳膊能碰巧掃到楊植麟的微信。楊植麟至少被現場參會人員簇擁圍堵了三次，才在工作人員的協助下成功離開會場。

2024年6月14日至15日，備受矚目的ai領域盛會“2024北京智源大會”在中關村展示中心盛大召開。《每日經濟新聞》記者現場注意到，這場被譽為“ai界春晚”的大會，在近年來大模型浪潮的推動下，呈現出愈發濃厚的氛圍，國產大模型明星公司也成為參會者關注的焦點。

不同於上屆以國外技術人員、從業者為主，圍繞技術探索展開的大會，今年百度、月之暗面、智譜ai、零一萬物、面壁智能等國產大模型公司成為論壇主角。與此同時，隨着大模型從技術競速逐步邁向落地應用，一些新的變化正在發生。

在今年的“ai界春晚”上，百度、月之暗面、智譜ai、零一萬物、面壁智能等國產大模型公司成為論壇主角。圖為2024北京智源大會現場。主辦方供圖

新主角：國產大模型站在舞台中央

在今年的“ai界春晚”上，國產大模型企業成為主角。

“進入到2023年，大模型從研究機構的科研成果開始向產業界逐步發展，我們也看到，百花齊放，有越來越多的大模型在過去的這一年發布。”智源研究院院長王仲遠在發言中提到。

王仲遠認為，以2023年為界，人工智能基本上可以分為兩個大的階段：2023年之前都屬於弱人工智能時代，即人工智能的模型是針對特定的場景、特定的任務，需要去收集特定的數據，訓練特定的模型。比如說，戰勝人類世界圍棋冠軍的alphago在圍棋上表現得非常好，但是卻無法用來直接解決醫療問題，雖然方法可以借鑒，但是針對不同的場景任務需要重新進行數據和模型的收集和訓練。進入2023年，隨着大模型的發展，人工智能逐步進入通用人工智能時代，而通用人工智能最大的特點就是它的規模非常大，模型具備湧現性，能夠跨領域通用。

2023年和2024年的北京智源大會，如同兩個對比鮮明的畫面，尤其是在大模型技術的發展和應用上，兩屆大會的嘉賓構成和議題變化，成為大模型時代飛速發展的註腳。

2024年的智源大會，嘉賓陣容發生了顯著的變化。更引人矚目的是國內大模型公司，如百度、月之暗面、零一萬物、智譜ai、面壁智能等大模型明星公司的ceo（首席執行官）與cto（首席技術官），以及來自國內頂尖院校和研究機構的代表。此次會議更加聚焦於人工智能關鍵技術路徑和應用場景，從理論探討向實際應用邁進了一大步。

在2023年的大會上，chatgpt剛剛推出半年，國內大模型啟動跟進，“百模大戰”剛剛迎來開端。彼時，大會的主角是來自全球的頂尖學者和科技巨擘，國內則更多以學界為主。在彼時的主論壇環節，兩組對談嘉賓分別是：meta首席ai科學家、紐約大學教授楊立昆與清華大學計算機系教授朱軍；未來生命研究所創始人max tegmark與清華大學智能產業研究院（air）院長張亞勤，對談內容圍繞ai技術層面的探索展開。

如今，變化已經非常明顯。“百模大戰”愈演愈烈，折射出國內大模型市場的快速崛起和自主創新能力的顯著提升。

隨着大模型由科研走向產業，人們對agi（人工通用智能）有了更多想象。王仲遠也提到，當多模態大模型能夠理解和感知、決策這個世界的時候，它就有可能進入到物理世界。如果進入到宏觀世界跟硬件結合，這就是具身大模型的發展方向。如果它進入到了微觀世界，去理解和生成生命分子，那麼這就是ai for science。無論是具身模型還是ai for science，抑或是多模型模態，都會促進整個世界模型的發展，最終推動人工智能技術向agi方向發展。

一個共識：落地！落地！落地！

儘管面臨挑戰，但技術的普及與落地已經顯著加速，預示着人工智能正邁向一個全新的發展階段。一個重要的共識是，在將agi的理想帶入現實世界的路上，落地應用是重要的必答題。

“零一萬物堅決做to c（面向個人），不做‘賠錢的to b（面向企業）’，找到能賺錢的to b，我們就做，不賺錢就不做。”李開復表示。

對於大模型的落地應用，李開復認為，在中國to c短期更有機會，國外兩者都有機會。在to c端，大模型就如同互聯網時代或pc時代的新技術、新平台，將會帶來新應用，這是巨大的機會。他判斷，ai時代，第一個階段突圍的應該是生產力工具；第二個階段可能會是娛樂、音樂、遊戲；第三個階段可能會是搜索；再下一個階段可能會是電商；然後可能會有社交、短視頻、o2o（線上到線下），這是不變的定律。

張亞勤則認為，再分層來看，目前真正賺錢的是to b，是在硬件、在芯片、在基礎設施層，這個是目前已經發生的，但是從應用來講，是先to c再to b。對於當前的ai分層，張亞勤將其劃分為信息智能、物理智能（也稱為具身智能）以及生物智能。在具身智能階段，面向企業的應用可能會發展得更為迅速。而到生物智能階段，情況可能恰好相反，面向個人的應用會超過面向企業的應用。各個領域的情況可能不盡相同，但總體來看，面向企業和面向個人的應用，包括開源模型、商業閉源模型、基礎大模型、垂直行業大模型以及邊緣模型，都會存在。

而對於b端的落地應用，李開復認為，to b是大模型帶來的更大的價值，而且應該更快實現，但是可惜的是在to b這個領域面臨幾個巨大的挑戰。

一方面部分大公司、傳統公司看不懂大模型技術，不敢進行顛覆式應用。與此同時，對企業來說這一年（大模型）帶來的最大的價值是降本，而不是創造價值。而降本說實在的就是取代人類的工作，大公司會有很多高管或者中層管理人員不願意做這個事情，因為做了這個，可能團隊就要被砍掉了，他在公司的資本就沒有了，他的權力就變小了，甚至他自己的工作都沒有了。所以大公司有時ceo是很想做，但是下面會有阻力，這些理由造成to b理論上應該馬上可以落地的，但實際上沒有那麼快。

另一個在中國比較嚴重的問題是，很多大公司沒有認識到軟件的價值，不願意為軟件付費，而且有這麼多大模型公司來競標，結果價格越競越低，做到最後是做一單賠一單，都沒有利潤。“我們在ai1.0時代看到這個現象，現在很不幸在ai2.0時代（它）又重現了。”李開復感嘆道。

百度cto王海峰的觀點是，在人類歷史上，每次工業革命的核心技術，不論是機械、電氣還是信息技術，均具備一些共同特性：首先，核心技術具有強烈的通用性，能夠廣泛應用於各個領域。其次，當這些技術具備了標準化、模塊化和自動化的工業大生產特徵時，這些技術就會進入到工業大生產階段，從而更快地改變人們的生產生活方式，並為人們帶來巨大的價值。當前，人工智能基於深度學習和大模型工程平台已經具備了極強的通用性，以及良好的標準化、自動化和模塊化特性。因此，王海峰認為，深度學習和大模型工程平台的結合，正在推動人工智能步入工業大生產階段，從而加速通用人工智能的來臨。

一個分歧：是否仍堅信scaling law

圍繞“scaling law”（規模定律）的討論開始出現分歧，對於scaling law會否失效、何時失效，明星大模型公司的掌舵者們，也給出了不同的判斷。

楊植麟依舊是堅定的scaling law信仰派。“scaling law沒有本質的問題，而且接下來3~4個數量級，我覺得是非常確定的事情。這裡面更重要的問題是你怎麼能夠很高效地去scale（擴展）？”

楊植麟指出，如今僅僅像現在這樣，依賴一些web text（網頁文本）進行scale，未必是正確的方向。因為在這個過程中可能會面臨諸多挑戰，如推理能力等問題，未必能夠得到有效解決。因此關鍵在於如何界定scaling law以及其實質是什麼。如果僅按照現有方法，進行next token prediction（下一標記預測），然後在此基礎上擴展多個數量級，用當前的數據分布，其上限是顯而易見的。

然而，scaling law本身並不受此限制，其核心是，只要具備更多的算力和數據模型，擴大參數規模，就能持續產生更多的智能。但在此過程中，它並沒有定義模型的具體形態，例如模型的模態數量、數據的特性和來源等。因此，楊植麟認為scaling law是一種會持續演進的第一性原理（first principle）。只是在這一過程中，scale的方法可能發生很大變化。

百川智能ceo王小川則認為，scaling law到目前沒有看到邊界，依舊在持續地發揮作用，“我們看到美國埃隆·馬斯克號稱要買30萬片b100、b200來做”。

在他看來，我們需要在scaling law之外，去尋找範式上新的轉化，而在scaling law上，很明確，就是在美國後面跟進。從戰略上看，在scaling law之外都還存在範式的變化，走出這樣的體系，才有機會走向agi，才有機會跟最前沿的技術較量。

智譜ai公司ceo張鵬與面壁智能ceo李大海，則持相對謹慎樂觀的態度。張鵬認為，包括scaling law在內，目前為止人類認識到的所有的規律都有可能被推翻，只是看它的有效期是多長。但目前為止還沒有看到scaling law會失效的預兆，未來的相當一段時間之內它仍然會有效。“隨着大家對規律的認知越來越深，規律的本質越來越（被）揭示，掌握本質就能掌握通往未來的鑰匙。基於現在大家對本質認識的深淺，至少在我們看來，（scaling law）仍然還會起效，會是未來我們主力想要推進的方向”。張鵬說。

李大海同樣表示，scaling law是一個經驗公式，是行業對大模型這樣一個複雜系統觀察以後的經驗總結，隨着訓練過程中實驗越來越多、認知越來越清晰，會有更細顆粒度的認知。比如模型訓練中的訓練方法本身對於scaling law、對於智能的影響是比較顯著的。在將模型參數控制在一定規模後，這種顯著影響變得尤為重要，在確保終端芯片能夠支持該規模模型的同時，實現優質智能，數據質量和訓練方法等因素亦至關重要。

毫無疑問的是，scaling law在當前階段仍然是驅動大模型發展的重要理論基礎，但其在未來的應用和擴展方式可能會面臨更多挑戰和變化。隨着技術的進步和對規律本質認識的深化，行業也可能需要進一步優化模型訓練方法，才能應對智能推理等更高級別的挑戰。

每日經濟新聞

標籤：娛樂頭條

上一篇： 618最後28小時，“卷王”京東卷完補貼卷晚會

下一篇：繼四根蔥打碼暗諷王思聰後！黃一鳴不甘心，將放出大瓜再錘王思聰