更像人的OpenAI o1影響力多大？

2024-10-12 00:30:14 娛樂頭條 9682℃

　　極客公園創始人、總裁張鵬，階躍星辰創始人、首席執行官姜大昕，月之暗面kimi創始人楊植麟，清華大學人工智能研究院副院長、生數科技首席科學家朱軍在雲棲大會上。受訪者供圖

　　近日，美國人工智能公司openai旗下首款具備「推理」能力的模型o1和o1-mini正式向企業版(enterprise)和教育版(edu)用戶開放訪問權限。據悉，用戶每周最多可輸入50條消息。

　　openai o1系列模型被業界認為是agi(通用人工智能)的一大進程，不僅解決了此前備受爭議的「13.11與13.8比誰大」的數學問題，還解決了科學、編程方面的問題，比此前的大模型能處理更為複雜的任務。

　　在近期舉行的雲棲大會上，針對包括「openai o1可能會帶來哪些影響」「目前大模型的發展是加速還是減速」「目前ai給產業帶來了哪些影響」等議題，對中國ai影響頗大、被譽為「ai六小龍」的幾位大模型公司掌舵者——階躍星辰創始人姜大昕、月之暗面kimi創始人楊植麟以及清華大學人工智能研究院副院長、生數科技首席科學家朱軍，展開了精彩的討論。

　　更像人的o1帶來新的創業機會　　

　　openai o1大模型的面世，再次引起了人們的關注。不過，openai o1的發佈在業界引起了不同的聲音。

　　在階躍星辰創始人、首席執行官姜大昕看來，openai o1第一次證明了語言模型其實也可以有人腦的慢思考——即一種被稱為「系統2」的能力。「系統1」是一種直線思維，擁有「系統1」能力的gpt4能把一個複雜問題拆解成很多步，再分步去解決，但它還是直線性思維的。而「系統2」的能力則能探索不同的路徑、自我反思和糾錯，不斷試錯直到找到一個正確路徑。而openai o1正是將以前的模仿學習和強化學習結合了起來，使得一個模型同時有了人腦「系統1」和「系統2」的能力。

　　姜大昕認為：「以前強化學習的場景都是為特定場景去設計的，比如alphago只能下圍棋，alphafold只能去預測蛋白質的結構。但openai o1的出現使得強化學習通用性和泛化性上了一個大台階。儘管openai o1目前還沒有到很成熟的階段，還是一個開端，但這恰恰讓人覺得非常興奮，這相當於openai找到了一條上限很高的道路，而且仔細思考它背後的方法，會發現這條路能走得下去。」

　　目前，學術界與產業界對agi（通用人工智能的簡稱）做了l1-l5的分級。l1相當於聊天機械人，類似chatgpt；l2是推理者，可以做複雜問題深度思考的推理；l3為智能體，可以改變和做交互，從數字世界走向物理世界；l4是創新者，能去發現、創造一些新的東西，或者發現一些新的知識；l5是組織者，可以去協同或者以某種組織方式更高效來運轉。每一級都有狹義和廣義的區分。清華大學人工智能研究院副院長、生數科技首席科學家朱軍認為，從這個意義上來看，openai o1已經在l2的某些特定任務下實現了人類高階的智能水平。從分級角度來看，它確實代表着整個行業巨大的進步。

　　月之暗面kimi創始人楊植麟也表示，openai o1提高了ai的上限，人類可能只能使用ai提升5%-10%的生產力，但openai o1可能用ai提升10倍的生產力。在楊植麟看來，這也會對產業格局或創業公司產生變化。「我覺得很關鍵的一個點是訓練和推理算力佔比會發生很大的變化，這個比例的變化本質上會產生很多新的機會。」

　　面壁智能ceo李大海則表示，openai o1模型再次表明，原始和基礎創新是人工智能發展的核心驅動，通過這次技術變革，大模型的算力重心可能逐漸從訓練階段轉向推理階段，大模型的研究中心也可能逐漸由自監督預訓練範式轉向強化學習範式和對齊階段。　　

　　雲設施、算力都準備好了　　

　　從chatgpt面世引發整個世界開始關注agi，發展到現在已經過去了18個月，大模型發展的技術是在加速還是在減速？agi發展到了哪個階段？

　　姜大昕表示，過去18個月大模型不僅在加速發展，而且發展速度還非常快。從「量」的角度來看，每個月都有新模型、新產品、新應用湧現。「比如單從模型來看，openai過年的時候發了一個sora，把大家轟炸了一下。5月份出了一個gpt-4o，上周又出了o1。openai的老對手anthropic它有claude3到claude3.5的系列，再加上谷歌gemini系列、claude系列、llama的系列等。過去我們的感覺是openai一家獨大，遙遙領先。今年就變成了一個群雄並起、你追我趕的局面，感覺各家發展都在提速。」

　　從「質」的角度，姜大昕表示，過去18個月發生了不少標誌性事件。比如gpt-4o的發佈讓多模態融合上了一個台階，將視覺理解、聲音、視頻生成等原本孤立的模型融合在了一起。而多模態的重要之處在於，物理世界本身就是多模態的世界，多模融合有助於模型更好地模擬物理世界。

　　此外，「特斯拉發佈的端到端大模型fsd v12也是一大標誌性事件。」姜大昕認為，智能駕駛是一個從數字世界走向物理世界的真實應用場景，fsd v12的意義不僅在於智駕本身，這套方法論可以為將來智能設備如何和大模型相結合、如何更好地去探索物理世界指明了一個方向。

　　對於當下大模型的發展狀態，楊植麟則表示，從縱向維度看，模型的智商一直在提升，在數學能力、編程能力和能理解的上下文長度方面都有所體現。「比如競賽數學的能力，去年完全不及格，今年已經能做到90多分；像代碼基本上也能夠擊敗很多專業的編程選手了，也產生了很多新的應用機會。另外，現在的語言模型能支持的上下文的長度，去年這個時間點大部分模型都只能支持4k-8k的，如今128k是一個標配，很多模型甚至可以支持1m甚至10m的長文本的長度，這個其實也是模型智商不斷提升的一個很重要的基礎。」

　　從橫向維度看，模型的各種模態也在發展，這就讓模型能具備更多技能、完成更多任務。「橫向上也產生了很多新的突破，當然sora可能是影響力最大的，比如視頻生成。最近有特別多新產品和技術出來，現在可以通過一個論文直接生成雙人對話，基本上看不出來是真是假。類似這樣不同模態之間的轉化、交互和生成會變得越來越成熟。」

　　朱軍也表示，整體進展在加快，大家都在解決新問題，解決新問題的速度也同時在加快。今年2月sora震驚了很多人，因為它沒有公開數據，當時還疑惑怎麼去突破？但現在大概用了半年的時間，已經做到了可以去用視頻模型，而且達到了很好的效果。

　　朱軍認為，加速的核心原因是大家對路線的認知和準備已經達到一定程度，物理上雲設施、算力資源也準備得比較好了，不再像chatgpt剛出來時的不知所措。「當然不同的能力它再輻射到實際用戶也有一些行業之分，但從技術來說，其實這個進展曲線是越來越陡，未來向更高階的agi發展可能會看到比之前更快的速度去實現了。」　　

　　ai進一步改變物理世界、產品形態　　

　　「過去22個月，ai發展的速度超過任何歷史時期，但我們依然還處於agi變革的早期。生成式ai最大的想像力，絕不是在手機屏幕上做一兩個新的超級app，而是接管數字世界，改變物理世界。」雲棲大會上，阿里巴巴集團ceo、阿里雲智能集團董事長兼ceo吳泳銘提到，生成式ai讓世界有了統一的語言——token，ai模型可以通過對物理世界數據的token化，理解真實世界。吳泳銘還重點提到了汽車與機械人兩大行業，並斷言未來所有能移動的物體都會變成智能機械人。

　　朱軍也提到，目前ai指向兩個方向，一是讓消費者看到的數字內容更好看、自然。另一個方向則指向實體和物理世界，一個較好的結合點是機械人。「我們自己實驗室做的像四足機械人，過去大家在不同場地上，它跑起來需要很多的人工調參。但現在在一個仿真環境里，或者用ai方式生成一些合成數據，讓它在裏面大規模地訓練，訓練出來的策略可以灌到機械人上，它相當於換了一副大腦，可以讓四肢更好地協同起來，同樣一套策略可以做各種場地的適應。其實這還是一個初步的例子，現在大家也在關注更複雜的控制決策，就像空間智能、具身智能。」朱軍稱。

　　朱軍還表示，等到agi發展到l3智能體階段時，機械人能更好地做推理規劃，更好更高效地和環境做交互，更好地完成人類的複雜任務。「未來，我們很快可以看到機械人可以接受複雜的指令、完成複雜的任務，通過它內嵌的思維鏈或者過程的學習方式，能夠完成複雜任務。到那個時候，智能能力又有一個很巨大的提升。」

　　楊植麟也表示，目前的ai進展會使聊天產品的形態一定會發生變化。「以後的ai可能不光是像現在這樣，思考個20秒、40秒，它可能已經要調用各種工具，執行分鐘級別、小時級別甚至天級別的任務，產品形態上可能會更接近一個人，更接近『助理』的概念，幫你完成異步的任務（一個過程中並發執行的任務）。這裏面的產品形態設計可能也會發生很大的變化，新的想像空間蠻大的。」　　

　　采寫：南都記者林文琪

標籤：娛樂頭條

上一篇：周潤發張譯黃渤加盟，陳思誠的《唐探前傳》票房有望突破60億

下一篇：女神姐姐劉亦菲曬阿布扎比觀賽照：我玩得非常開心！