今夜來襲!OpenAI線上直播或開啟語音助手新時代,電影《她》也將走進現實?

每經記者:文巧    每經編輯:蘭素英

從今夜開始,openai線上直播、谷歌2024年i/o開發者大會、微軟build年度開發者大會、英偉達一季報以及蘋果年度開發者大會將在未來的一個月悉數上演。

當地時間5月13日上午10點(北京時間5月14日凌晨1點),openai線上直播將率先登場,展示chatgpt新功能和升級版gpt-4,該公司已經在官網發佈預約頁面,但相關細節尚未公布。

圖片來源:openai

the information援引消息人士稱,openai準備在活動中展示能夠使用聲音和文本與人交談以及識別物體和圖像的技術,這一技術將被整合到萬眾期待的語言助手產品中。

此外,《每日經濟新聞》記者在x平台上注意到,有網友扒出chatgpt的代碼,顯示其或將具備語音通話能力。有人戲稱,電影《她》中的場景即將走入現實。

外媒此前預計本次直播會將發佈有關搜索引擎或gpt-5的消息,但隨後openai首席執行官sam altman駁斥了這些謠言。隨着谷歌、meta等競爭對手相繼發佈新的多模態大模型,外媒報道稱,openai可能會在今年年底前公布gpt-5以期保持領先地位。

openai線上直播有兩大亮點值得關注

儘管openai官網未提供有關此次直播演示的相關細節,但記者經過梳理髮現,此次活動上有兩大亮點值得期待。

亮點一:語音助手

據the information獨家報道,openai準備在這場即將開始的活動中展示能夠使用聲音和文本與人交談以及識別物體和圖像的技術,並將該技術整合至一個語音助手產品中。這意味着,這款ai助手所基於新的多模態模型能夠更好地理解圖像和音頻。

報道援引知情人士稱,該公司開發人員已經向一些客戶展示了這款ai助手的其中一些功能,其邏輯推理能力比當前的產品更優秀。

報道稱,openai首席執行官sam altman的目標是,最終開發出類似於斯派克•瓊斯電影《她》的虛擬助手,使蘋果siri等現有語音助手變得更加智能。altman認為,具有視覺和音頻功能的ai助手與智能手機一樣,都有變革性的潛力。理論上,ai助手可以充當學生導師、解決汽車故障等許多角色。

不過,報道稱,該產品目前無法在個人設備上運行,客戶在短期內可以使用基於雲的版本來部署或改進功能,例如自動化客戶服務代理。目前尚不清楚openai何時向其付費客戶提供這些新功能,但它最終計劃將這些新功能納入其聊天機械人chatgpt免費版本的一部分。

亮點二:chatgpt將具備通話功能

記者注意到,在x平台上,一位名叫ananay arora的開發人員發佈了疑是chatgpt通話相關代碼的屏幕截圖。他表示,openai可能正在準備在chatgpt中內置通話功能。

圖片來源:x平台

此外,arora還發現了openai已配置用於實時音頻和視頻通信的服務器的證據。

圖片來源:x平台

基於此,有網友評論猜測,「這是不是意味着chatgpt能夠主動給我打電話,而不需要我先發起呼叫?」而這一幕,在電影《她》中就曾出現——ai助手薩曼莎會主動給男主人公打電話。

圖片來源:x平台

除此之外,hallid.ai的聯合創始人indigo在x平台上預測稱,gpt-4 的新版應該會按照參數規模不同分化成多個版本,他同時說道:「gpt-3.5 的歷史使命結束了,gpt-4的輕量版可以在chatgpt中免費使用,而且api的價格會大幅下降。」

圖片來源:x平台

indigo的猜測與openai的目標是一致的。據the information報道,openai的目標正是讓支持前述新功能的ai模型比目前銷售的最先進模型gpt-4 turbo的運行成本更低。

據悉,openai今年還計劃發佈一種新的定價模型,如果客戶預付費,該模型將為客戶提供高達50%的折扣。目前,openai主要提供按需定價,大模型每生成100萬token,向開發者收取幾美分到120美元不等的費用。

據悉,提前付款折扣在雲計算中很常見——microsoft azure、google cloud 和 amazon web services的客戶就可以通過提前預留服務器容量來降低成本。憑藉更靈活的定價,openai可以更好地與競爭對手角逐。

gpt-5或年底前公布,openai盈利仍面臨挑戰

隨着谷歌、meta等競爭對手相繼發佈新的多模態大模型,例如meta在4月份發佈開源模型llama 3,谷歌在去年12月發佈gemini,外界猜測,openai即將公布gpt-5以期保持領先地位。此外,近期一系列報道稱,openai也在致力於推出一款網絡搜索引擎,旨在與谷歌搜索搶奪市場份額。

不過,在此前接受外媒採訪時,altman表示,openai並不會在本次直播活動中發佈gpt-5,也不會發佈ai搜索引擎。

儘管如此,該公司並未否認正在開發在線搜索產品的傳言。科技媒體inquirer tech報道了一個名為「search.chatgpt.com」的域名和ssl認證,稱這是與openai在線搜索項目相關的有力線索。此外,據報道,該公司可能會在今年年底前公布gpt-5。

儘管openai在ai模型上傾注大量精力,但the information也表達了對該公司接下來如何創造實際利益的擔憂。例如,openai曾向開發人員承諾,到今年第一季度,將能夠通過gpts構建定製聊天機械人來賺錢,但迄今該公司尚未推出一種有效的方式達到目的。

另一方面,外媒報道稱,蘋果接近與openai就下一代iphone操作系統如何集成chatgpt達成協議。然而,openai依然面臨著激烈的競爭:蘋果同時也正在與谷歌進行類似的談判,以期將gemini應用於智能手機中。

此外,altman還正與蘋果前設計師jony ive合作開發一款單獨的ai消費設備。然而,最先進的ai模型規模十分龐大,意味着目前需要在雲端運行,並且需要互聯網連接才能工作,具有視覺和音頻功能的ai模型可能需要數月甚至數年的時間才能變得足夠小以在設備上運行。

每日經濟新聞