AI尖峰對話:被「追星」的楊植麟,被「認可」的價格戰

作為開幕式最後一個環節的嘉賓、月之暗面ceo楊植麟剛走下台就被團團圍住,楊植麟一邊為難地重複著「以後還有機會」,一邊在工作人員的幫助下匆忙離場。

這是外行愛看的熱鬧。6月14日,北京智源大會開幕。我們在離楊植麟最近的地方,見證了一次大模型的「追星」現場。

當天,楊植麟和百川智能ceo王小川、智譜ai ceo張鵬、面壁智能ceo李大海進行了一場尖峰對話。我們在離ai領域最炙手可熱的創業者們最近的地方,聽到了對agi的討論,對scaling law的「信仰」,對大模型價格戰的「認可」。

這是內行愛聽的門道。兩個場景,是中國ai市場由表及裡、由外向內的寫照。兩者相連,既是現在,也是未來。

什麼是agi

大模型的突破,讓人類通往agi的終極幻想有了更大的可能。但對於agi本身,業內似乎並沒有統一定義。

楊植麟認為,當下agi或許並不一定需要一個精確的、量化的定義,它也可能是一個定性且感性的存在,它的意義在於讓社會或者人類對接下來要發生的事情有一個準備。不過楊植麟認為,在短期內,確實需要這樣一種量化的定義,「因為如果完全沒有量化,也自然無法衡量agi開發的進度,從而影響整體發展」。

張鵬也更願意相信,agi是一種信念,一種符號,其內涵外延是在不斷變化的。如果能把一件事情說的非常量化、非常清晰,那麼天花板估計也就觸手可及了。張鵬認為,對人工智慧的發展而言,沒人能夠說清楚什麼是agi,反而可能是一件好事,這意味著還有更多未知空間等待探索。

王小川試圖從「人」的角度理解agi,即大模型能不能「造醫生」。之所以選擇這一指標,是因為agi的第一個變化是大模型開始具有思考、學習、溝通、共情甚至多模態處理能力,就像是醫生,既需要多模態,也需要減少幻覺,同時需要有強大的記憶能力、查文獻能力、推理能力,如果把行業上能共識的能力都投射到做醫生的標準中,那麼這便可以成為一個指標——「人造醫生」就是agi。

李大海則嘗試從經濟學的角度定義agi。在他看來,一個理想中的agi,就是去執行任何任務的時候,邊際成本都已經降為0。去年行業里大家推動大模型落地時,很多場景還需要做微調,這個過程的邊際成本就很高。「我們相信,隨著模型能力的提升,大模型門檻越來越低,成本也越來越接近於0的時候,agi基本也就到來了。」

scaling law還是「信條」嗎

北京智源大會上,一個詞被反覆提及——scaling law,這個類似於大模型版的「大力出奇蹟」的法則,成功塑造出了openai。但隨著時間的推移以及ai的發展,這個參數越多模型越強的黃金法則,也逐漸陷入了摩爾定律一般是否接近失效的討論。

談及scaling law,楊植麟認為,scaling law本質上沒有問題,只要有更多算力、更多參數,就會持續演進。但在這個過程中,如果一直沿用現在的方法,上限是很明顯的,更關鍵的在於如何更高效地實現scaling law。

王小川也認為,在scaling law之外,一定要在數據、演算法、算力等方面尋找範式上新的轉化,「不論是戰略上還是信仰上,我認為scaling law之外都還有範式變化的可能,不只是去簡單的變成壓縮模式,而是會走出一個體系,這樣才有機會走向agi,才有機會與前沿技術較量」。

「到目前為止,還沒有看到scaling law會失效的預兆,未來相當一段時間之內scaling law仍然會有效,當然這個有效也是一個動態概念,關鍵在於它本身所包含的事情會不斷演進」。張鵬也贊同王小川的觀點,稱scaling law早期關注參數規模,現在慢慢擴展,參數量、數據量以及數據質量的重要性也被逐漸重視,「隨著大家對規律的認知越來越深,逐漸揭示規律的本質,也就能逐漸掌握通往未來的鑰匙」。

推動大模型在端側的落地是面壁智能目前的重點工作之一,「小鋼炮」minicpm是一個重要抓手。scaling law在輕量級模型上是否依然有效,成為一個新的問題。

對此,李大海選擇依然堅信scaling law。李大海稱,scaling law是一個經驗公式,是行業對大模型這樣一個複雜系統觀察後的經驗總結,隨著訓練過程中實驗越來越多,認知越來越清晰,也會有更細顆粒度的認知。比如模型訓練方法和數據質量對scaling law和智能的影響較為顯著。

價格戰是好是壞

5月下旬,當國產大模型激戰「價格戰」的時候,王小川曾表現出過一種「他強任他強,清風拂山崗」的淡定。當時被外界反覆引用的一句話是王小川說的,「創業公司不在大廠射程內」。

從以「厘」為計算單位,到「掀桌子」全面免費,整個5月,大模型都陷入了被價格戰支配的熱潮之中,特別是阿里、百度、科大訊飛、騰訊雲先後跟進,讓大模型的價格戰進入了白熱化階段。

但現在,王小川的態度有了些微妙的變化。北京智源大會上,王小川明確表示,當下的價格戰對中國發展大模型而言是非常特別的一件事,「我積極看待這件事」。

在王小川看來,價格戰通常是以競爭為導向的市場行為,這會讓更多公司、更多人用上大模型,使大模型能夠迅速普及。另一方面,之前鑒於行業的「焦慮」,很多本該是大模型使用方的企業,也都想轉型成為大模型的供給方,造成人才、資金等方面的浪費。價格戰之後,很多企業也開始清醒,思考自己的競爭優勢,進而退回成為大模型的用戶,減少浪費的同時,讓更多企業找到適合自己的發展定位。

李大海也認同,當前的價格戰,雖然多少存在一定的營銷成分,但未來一定會比現在的價格更低,「大家都有利潤,才是健康的方式,才能真正讓千行百業的應用落地」。

早於位元組跳動大張旗鼓的降價,智譜ai一度被認為是這輪價格戰的發起方。大會現場,張鵬笑著澄清,「子虛烏有」。

張鵬說,從宏觀角度看,降價能夠促進大模型成為真正的基礎設施,但張鵬也提到,不能多過地注意、甚至宣揚這件事,「做虧本買賣不是正常的商業邏輯,不可持續,最終還是要回歸用戶價值、生產力價值」。

回歸價值本身,也是楊植麟的核心看法。他給出了三個判斷,首先未來一個很重要的節點,是推理上的算力顯著超過訓練算力,這標誌著價值開始得到釋放。第二的重要節點,是c端推理成本顯著低於獲客成本,與之前的商業模式有了顯著區別。在這兩個前提之下,第三個關鍵在於,ai能做的事情可能會超過人做的事情,進而產生新的商業模式。

「這可能不是像今天談到的,在b端用api做價格戰,而是一種普惠ai,同時根據產生的價值形成商業模式。這三個點可能會是改變大模型商業模式本身或者roi問題很重要的途徑」。楊植麟說。

在接受北京商報等媒體群訪時,智源研究院院長王仲遠也不可避免地被問到了價格戰的問題。王仲遠認為,降價是件利弊並存的事。

一方面降價對於開發者開發應用場景,接入大模型做更多嘗試,存在價值。但另一方面,如果降價持續且低於實際成本的話,很可能得不償失。

「畢竟大模型迭代仍然需要巨大資金投入,而中國的大模型也不應該停留在gpt-4的水平,我們更樂於看到一個良好的產業生態健康地發展,這也意味著它需要找到自己的產業模式、商業模式」。王仲遠說。

而對開發者,王仲遠認為,選大模型應該優先考慮的不是性價比,而是性能。王仲遠說:「在此基礎之上,我相信價格最終都會回歸到合理的水平。而且對於好用的大模型來說也存在規模效應,如果使用規模上去了,工程師們自然有條件做工程系統上的優化,價格也會自然而然下降,從而避免出現劣幣驅逐良幣」。

北京商報記者 楊月涵