清華ChatGLM2-6B模型允許免費商用 開啟 AI 研究新紀元

明星新聞 4741℃

清華大學的 NLP 團隊與智譜 AI 及清華 KEG 實驗室宣布,他們的 ChatGLM-6B 和 ChatGLM2-6B 模型現已完全開放權重,允許學術研究和商業使用。這兩個模型在人工智慧研究領域具有重要意義。

ChatGLM-6B 模型是基於 General Language Model(GLM)架構的中英雙語對話模型,擁有62億參數。通過模型量化技術,該模型可以在消費級顯卡上進行本地部署,最低只需6GB 顯存。該模型具備問答和對話功能,初步展現了其在人工智慧領域的應用潛力。

清華ChatGLM2-6B模型允許免費商用 開啟 AI 研究新紀元 - 陸劇吧

ChatGLM2-6B 模型在保留了初代模型的對話流暢和低門檻部署特性的基礎上,增加了更多新特性。首先,它採用了 GLM 的混合目標函數,經過了1.4T 中英標識符的預訓練和人類偏好對齊訓練,性能得到了顯著提升。其次,上下文長度從 ChatGLM-6B 的2K 擴展到了32K,可以處理更長的對話內容。第三,推理速度提升了42%,並且在 INT4量化下,6GB 顯存可以支持更長的對話長度,從1K 提升到了8K。最重要的是,ChatGLM2-6B 的權重對學術研究是完全開放的,這對於推動人工智慧技術的發展具有積極意義。

這兩個模型的開放將為學術界和商業領域的研究者提供更多機會,推動人工智慧的創新與應用。他們的發布也標誌著清華大學在人工智慧領域的重要突破,為全球的 AI 研究和應用探索開啟了新的篇章。未來,我們可以期待更多基於 ChatGLM-6B 和 ChatGLM2-6B 模型的研究成果和應用場景的出現,推動人工智慧技術的發展進程。

標籤: 明星新聞