撰文 | 張 宇
編輯 | 楊博丞
題圖 | 圖蟲創意
1月16日,ai知識智能技術開發商智譜ai舉辦了首屆技術開放日(zhipu devday),全面展示了其投身大模型事業三年多以來所積累的技術成果,並發布了新一代基座大模型glm-4。
智譜ai ceo張鵬表示,glm-4的整體性能相比上一代大幅提升,逼近gpt-4,可以支持更長的上下文,具備更強的多模態能力。同時,glm-4的推理速度更快,支持更高的並發,大大降低推理成本。
圖源:智譜ai
除此之外,glm-4大幅提升了智能體能力,glm-4 all tools實現自主根據用戶意圖,自動理解、規劃複雜指令,自由調用網頁瀏覽器、code interpreter代碼解釋器和多模態文生圖大模型以完成複雜任務。glms個性化智能體定製功能亦同時上線,用戶用簡單的提示詞指令就能創建屬於自己的glm智能體,大幅降低了大模型使用門檻。
「追趕openai」「對標open ai是智譜ai成立以來的目標」,是張鵬在對外分享時屢次提及的幾句話,目前大模型的競爭已經不再是從0到1的有與無之爭,而是落地之爭,各家大模型開始貼身肉搏,被稱為「中國openai」的智譜ai,究竟能否在大模型角逐戰中順利突圍?
一、暫時難以對標openai
智譜ai作為國內第一開源大模型,有著較強的技術架構,但對標openai仍有一些距離。
張鵬坦言,和國外大模型相比,國內的大模型發展起步晚了一些,加上高性能算力限制、數據質量的差距等,國內大模型在規模和核心能力上都與世界先進水平存在一定差距,這樣的差距大約在一年左右。
從技術路線來看,openai則更加註重通用性、可移植性和可擴展性,其gpt系列模型可以在多個場景下應用,並且具有高度的可定製性。相比之下,智譜ai的技術路線是「大模型+小模型」,通過大模型的預訓練和微調,來適應不同場景和任務的需求。這種技術路線可以提高模型的泛化能力和應用範圍,但也存在著模型複雜度高、計算量大、訓練時間長等問題。
在模型規模,openai的gpt系列模型規模較大,可以處理大量的自然語言數據,從而獲得更好的模型性能。相比之下,智譜ai的模型規模可能較小,處理數據的能力有限,這可能會影響其模型性能和泛化能力。而在數據資源方面,openai擁有大量的自然語言數據資源,可以用來訓練和優化其模型。相比之下,智譜ai的數據資源可能相對較少,導致其模型訓練的效果和性能受到限制。
這意味著,想要儘快彌補與openai之間的差距,智譜ai必須要持續提升大模型能力,訓練參數自然也需要提升,但硬幣的另一面是,智譜ai在資金方面也將面臨著一個巨大的難題。
首先,硬體是一筆巨額投入,根據美國市場研究機構trendforce推算,處理chatgpt的訓練數據需要2萬枚gpu晶元,而隨著openai進一步展開chatgpt和其他gpt模型的商業應用,其gpu需求量將突破3萬張(該報告計算以a100晶元為主)。
此外,訓練大模型的成本也不容小覷,根據國盛證券發布的《chatgpt需要多少算力》估算,gpt-3訓練一次的成本約為140萬美元,對於一些更大的llm(大型語言模型),訓練成本介於200萬美元至1200萬美元之間。
巨額資金從哪裡來,以及能換回多少價值,對於智譜ai而言是一個未知數。
不過,好在智譜ai備受投資機構青睞。2023年10月,智譜ai稱年內已成功融資超過25億人民幣。這一重要的融資里程碑得到了多家知名機構的積極支持,主要參與方包括社保基金、中關村自主創新基金、以及美團、螞蟻、阿里、騰訊、小米、金山、順為資本、boss直聘、好未來、紅杉、高瓴等多家機構,同時也包括一些老股東的跟投。
圖源:天眼查
尤其是2023年至今,智譜ai接連拿下5輪融資,估值超過100億元,躋身國內ai領域「獨角獸」企業。智譜ai表示,融資將被用於進一步推動其基座大模型的研發,以更好地支持廣泛的行業生態,促進與合作夥伴一起實現高速增長的願景。
二、商業化高牆難越
商業化落地是驗證一項新技術價值的最直接的方式。現階段來看,國內大模型百花齊放,但大部分仍處於講技術、講發展的階段,對於商業化落地,基本上處於探索階段。
整體而言,大模型企業的盈利方式主要包括大模型、大模型+算力、大模型+應用。其中,大模型和大模型+算力為主要盈利方式。
智譜ai盈利方式和行業盈利方式基本一致,一是根據客戶需求,提供大模型定製化開發服務,雲端私有化本地私有化最高價格分別為120萬元/年和3690萬元/年;二是標準版大模型,提供api接入方式,按照tokens使用收費,chatglm-turbo、characterglm、text-embedding收費標準分別為0.005元/千tokens、0.015元/千tokens、0.005元/千tokens。目前,智譜ai的商業化主要面向企業和機構的b端用戶。
作為對比,openai的商業化同樣分為c端和b端兩個部分,具體而言,針對c端市場,openai推出chatgpt plus訂閱計劃,每月收費20美元,相較於免費版本,即便在高峰時段用戶也能正常訪問chatgpt,響應時間更快,並且可以優先使用新功能等。而針對b端市場,openai發布了chatgpt api,開發者可以將chatgpt集成到產品中,以更加高效地發揮出價值。
值得注意的是,openai還在2023年8月推出了企業服務版,該服務版有望每月給openai帶來6500萬元的收入。整個2023年,openai推出的多項付費方案已經帶來了超過110億元的收入。
一個普遍的現象在於,包括智譜ai在內的國內大模型產品,在高投入的同時還難以帶來穩定的盈利。雖然大模型商業化之路道阻且長,但曙光已現。三六零2023年半年報顯示,「360智腦」大模型已經開始創收,金額近2000萬元;商湯集團也公布,生成式ai在2023年上半年相關收入增長670%。
愛分析相關報告指出,目前大模型商業化提速較快的行業為能源和金融,其原因在於這兩個行業密集分布的央國企。央國企數據基礎設施建設完備、算力投入高、ai應用場景多且基礎強,這些原因促進央國企與大模型的快速融合。
對於智譜ai而言,目前大模型商業化的路徑已經較為清晰,但能否走通大模型的商業化之路,關鍵不僅在於商業模式的探索嘗試,更在於解決大模型發展的底層問題。
三、國產大模型何去何從?
根據工信部賽迪研究院最新數據,2023年我國語言大模型市場規模實現較快提升,應用場景不斷豐富。預計2023年我國大模型市場規模將達到132.3億元,增長率將達110%。
未來,隨著技術的不斷迭代進步,大模型將在具身智能、自動駕駛等領域開拓新的應用場景。
具體而言,大模型的發展將有三大趨勢:首先是大模型智能能力的提升,未來大模型將具有更高的精度、更強的理解能力和更廣泛的適用性,這意味著大模型能夠更好地理解自然語言,還能夠進行更多的複雜任務,比如全域控制、創作等等;其次是大模型將應用於更多領域,除了傳統的文本處理之外,大模型也將在語音識別、圖像生成、視頻理解等方面發揮更大的作用,用戶可以在更多的場景中享受到ai帶來的便利。此外,大模型將更加定製化,能夠更好地滿足用戶的個性化需求,用戶可以根據自己的實際需求選擇合適的模型,並進行定製化配置。
大模型飛速發展,但並不意味著無序發展。未來,針對大模型的監管將愈加嚴格,2023年7月,網信辦等七部門發布了《生成式人工智慧服務暫行管理辦法》,明確規定大模型產品需注重數據隱私安全,不能非法獲取、披露、利用個人信息和隱私、商業秘密,不可侵犯知識產權;大模型生成的內容應當體現社會主義核心價值觀,不能生成歧視性的內容等等。
對於大模型的未來,張鵬顯得十分樂觀,「2024年,大模型市場將從野蠻生長回歸冷靜,對於大模型的投資與炒作將會告一段落,行業焦點也將從模型本身轉向尋找應用。不過這並不代表大模型的技術演進速度會下降,向上探索的天花板還遠遠沒到。」