這是美國開放人工智慧研究中心(openai)發布gpt-4o的直播視頻截圖
美國開放人工智慧研究中心(openai)13日展示最新版本chatgpt:與使用者展開語音對話、識別圖像並展開討論、翻譯……相比先前版本,它與使用者對話基本無延遲,會傾聽,能嘮嗑,還善於察言觀色,讓人驚呼新版本chatgpt「更像人」了。
新版本chatgpt取得了哪些突破?能在哪些領域實現應用?它對人工智慧領域的影響有多大?記者為您解局——
有哪些「進化」?
開放人工智慧研究中心13日發布的人工智慧模型名為gpt-4o,編號中的字母「o」代表「omni」(全能),既能接受文本、音頻和圖像的任意組合輸入,還能生成文本、音頻和圖像的相關回應。
這一中心不僅圍繞gpt-4o做了直播演示,還在社交媒體發布更多視頻「炫技」。
上面這段視頻中,gpt-4o聽起來明顯「更會聊天了」,還時不時拋出幾個笑話。它的音調有些許變化,言語間帶著笑意,與它聊天更像與真人交談。
實時聊天是chatgpt的關鍵技能。相比先前版本,gpt-4o的不同主要表現在:一是使用者可以隨時打斷聊天機器人,無需像從前那樣等它把話說完;二是它會實時對問題作出回應,不再有兩到三秒的時滯;第三,它能感知人的情緒,比如演示者呼吸急促,它會詢問對方是否需要稍稍穩定下情緒。另外,gpt-4o可以生成不同風格的聲音。
演示中,gpt-4o利用其視覺和語音能力,指導演示者在紙上逐步解出一道方程題,而不是直接給出答案。它還展示了英語與義大利語互譯、用自拍照片識別情緒等能力。當一名演示者告訴它,自己正展示它是「多麼有用和不可思議」時,它回答道:「哦,快別說了,怪害臊的。」
開放人工智慧研究中心首席執行官薩姆·奧爾特曼當天在博客中寫道,gpt-4o就像電影中的人工智慧技術。「與電腦交談一直讓我感覺不自然,現在自然了。」
應用潛力如何?
北京郵電大學人機交互與認知工程實驗室主任劉偉說,無論是在文本生成、做題、問答系統還是情感分析等任務中,gpt-4o都表現出很好的能力。這種技術的突破,無疑將對國內外的相關企業產生重大影響,它不僅推動了自然語言處理技術的發展,也讓人工智慧在多個領域的應用變得更加廣泛和深入。
他認為,gpt-4o將推動人工智慧在金融服務、教育、醫療、無人駕駛汽車等領域的應用,有望引領人工智慧技術全面發展。
4月23日,在德國漢諾威工博會上,參觀者與一款智能機器人進行「石頭剪子布」遊戲。新華社記者任鵬飛攝
近年來,開發更人性化、功能更強大的生成式人工智慧工具競爭激烈。就在開放人工智慧研究中心發布gpt-4o的第二天,谷歌母公司字母表公司召開谷歌開發者年度會議,人工智慧是重頭戲。矽谷企業家埃隆·馬斯克、技術企業「深層思維」創始人之一穆斯塔法·蘇萊曼也分別投資開發了聊天機器人grok和pi,將擬人化特點作為產品主攻方向。
英國廣播公司評論,gpt-4o能夠結合文本、音頻和圖像內容瞬間做出反應,目前在競爭中處於領先地位。
開放人工智慧研究中心首席技術官米拉·穆拉蒂說,gpt-4o定於幾周內上線,用戶可免費試用。chatgpt原有付費用戶將獲得新版本更多使用許可權。
需要擔憂什麼?
在開放人工智慧研究中心公布的一段演示視頻中,gpt-4o一步步引導一名男孩解答出數學題。一些網友直呼,再也不用輔導孩子寫作業了。一些人卻擔心,教師這一職業會不會被人工智慧取代。
一些人工智慧專家認為,新版chatgpt雖然可能比競爭對手水平更高且更易使用,但不太可能很快讓一些職業徹底消失,從事教學或翻譯工作的人更有可能會使用這些工具,而不是被它們取代。
新加坡人工智慧計劃人工智慧產品高級總監萊斯利·特奧說,教學工作涉及到人類的同理心,「教師自己經歷了學習過程並且了解人如何克服困難,而人工智慧不同」。他認為,教學、翻譯和客戶服務等工作不可能因gpt-4o的出現而消失。
也有一些專家認為,技術演示能在大多數人中引起反響,它通常是精心打造的,未必能反映產品的真實功能。
劉偉說,gpt-4o的語音功能改變了對話式人工智慧的遊戲規則,但依然沒有實現聊天機器人的深度態勢感知能力,比如意圖理解、動機分析等。此外,gpt-4o的進步在人工智慧倫理和安全方面帶來了新的挑戰,需要我們在數據隱私、信息可信性、潛在偏見、惡意使用、意識和責任等方面開展新的思考。
來源丨新華國際頭條(版權歸原作者所有,如有侵權請聯繫刪除)