清華ChatGLM2-6B模型允許免費商用開啟 AI 研究新紀元

2023-07-18 15:11:04 明星新聞 4741℃

清華大學的 NLP 團隊與智譜 AI 及清華 KEG 實驗室宣布，他們的 ChatGLM-6B 和 ChatGLM2-6B 模型現已完全開放權重，允許學術研究和商業使用。這兩個模型在人工智慧研究領域具有重要意義。

ChatGLM-6B 模型是基於 General Language Model（GLM）架構的中英雙語對話模型，擁有62億參數。通過模型量化技術，該模型可以在消費級顯卡上進行本地部署，最低只需6GB 顯存。該模型具備問答和對話功能，初步展現了其在人工智慧領域的應用潛力。

ChatGLM2-6B 模型在保留了初代模型的對話流暢和低門檻部署特性的基礎上，增加了更多新特性。首先，它採用了 GLM 的混合目標函數，經過了1.4T 中英標識符的預訓練和人類偏好對齊訓練，性能得到了顯著提升。其次，上下文長度從 ChatGLM-6B 的2K 擴展到了32K，可以處理更長的對話內容。第三，推理速度提升了42%，並且在 INT4量化下，6GB 顯存可以支持更長的對話長度，從1K 提升到了8K。最重要的是，ChatGLM2-6B 的權重對學術研究是完全開放的，這對於推動人工智慧技術的發展具有積極意義。

這兩個模型的開放將為學術界和商業領域的研究者提供更多機會，推動人工智慧的創新與應用。他們的發布也標誌著清華大學在人工智慧領域的重要突破，為全球的 AI 研究和應用探索開啟了新的篇章。未來，我們可以期待更多基於 ChatGLM-6B 和 ChatGLM2-6B 模型的研究成果和應用場景的出現，推動人工智慧技術的發展進程。

標籤：明星新聞

上一篇：《追光的日子》高遠把什麼扔了？

下一篇：回日本工作！香港知名女星機場被偶遇，素顏朝天打扮低調