當(dāng)前位置：首頁(yè) > 元宇宙 > AI

智譜發(fā)布新一代開源 AI 模型 GLM-4-32B-0414 系列，效果比肩 GPT 系列和 DeepSeek-V3 R1

來(lái)源：責(zé)編：時(shí)間：2025-04-17 06:44:23 153觀看

導(dǎo)讀 4 月 15 日消息，智譜昨日（4 月 14 日）發(fā)布博文，宣布推出新一代 GLM-4-32B-0414 系列模型，320 億參數(shù)，效果比肩 OpenAI 的 GPT 系列和 DeepSeek 的 V3 / R1 系列，且支持非常友好的本地部署特性。該系列模型共有 GLM-4

4 月 15 日消息，智譜昨日（4 月 14 日）發(fā)布博文，宣布推出新一代 GLM-4-32B-0414 系列模型，320 億參數(shù)，效果比肩 OpenAI 的 GPT 系列和 DeepSeek 的 V3 / R1 系列，且支持非常友好的本地部署特性。

該系列模型共有 GLM-4-32B-Base-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414 和 GLM-Z1-9B-0414 四款模型。

GLM-4-32B-Base-0414

在預(yù)訓(xùn)練階段，該模型采用 15T 高質(zhì)量數(shù)據(jù)，其中包含大量推理類的合成數(shù)據(jù)，這為后續(xù)的強(qiáng)化學(xué)習(xí)擴(kuò)展打下了基礎(chǔ)。

在后訓(xùn)練階段，除了針對(duì)對(duì)話場(chǎng)景進(jìn)行了人類偏好對(duì)齊外，團(tuán)隊(duì)還通過(guò)拒絕采樣和強(qiáng)化學(xué)習(xí)等技術(shù)強(qiáng)化了模型在指令遵循、工程代碼、函數(shù)調(diào)用方面的效果，加強(qiáng)了智能體任務(wù)所需的原子能力。

GLM-4-32B-0414 在工程代碼、Artifacts 生成、函數(shù)調(diào)用、搜索問(wèn)答及報(bào)告等方面都取得了不錯(cuò)的效果，部分 Benchmark 甚至可以媲美更大規(guī)模的 GPT-4o、DeepSeek-V3-0324（671B）等模型。

GLM-Z1-32B-0414

該模型是具有深度思考能力的推理模型，在 GLM-4-32B-0414 的基礎(chǔ)上，通過(guò)冷啟動(dòng)和擴(kuò)展強(qiáng)化學(xué)習(xí)，以及在數(shù)學(xué)、代碼和邏輯等任務(wù)上對(duì)模型的進(jìn)一步訓(xùn)練得到的。

相對(duì)于基礎(chǔ)模型，GLM-Z1-32B-0414 顯著提升了數(shù)理能力和解決復(fù)雜任務(wù)的能力。在訓(xùn)練的過(guò)程中，該團(tuán)隊(duì)還引入了基于堆棧排序反饋的通用強(qiáng)化學(xué)習(xí)，進(jìn)一步增強(qiáng)了模型的通用能力。

GLM-Z1-Rumination-32B-0414

該模型是具有沉思能力的深度推理模型（對(duì)標(biāo) Open AI 的 Deep Research）。

沉思模型通過(guò)更長(zhǎng)時(shí)間的深度思考來(lái)解決更開放和復(fù)雜的問(wèn)題（例如：撰寫兩個(gè)城市 AI 發(fā)展對(duì)比情況，以及未來(lái)的發(fā)展規(guī)劃），結(jié)合搜索工具處理復(fù)雜任務(wù)，并經(jīng)過(guò)利用多種規(guī)則型獎(jiǎng)勵(lì)來(lái)指導(dǎo)和擴(kuò)展端到端強(qiáng)化學(xué)習(xí)訓(xùn)練得到。

GLM-Z1-9B-0414

這是一個(gè)開源 9B 小尺寸模型，在數(shù)學(xué)推理和通用任務(wù)中依然展現(xiàn)出極為優(yōu)秀的能力，其整體表現(xiàn)已處于同尺寸開源模型中的領(lǐng)先水平。

測(cè)試結(jié)果

GLM-4 系列在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異。例如，在 IFEval 指令遵循測(cè)試中得分 87.6；在 TAU-Bench 任務(wù)自動(dòng)化測(cè)試中，零售場(chǎng)景得分 68.7，航空?qǐng)鼍暗梅?51.2；在 SimpleQA 搜索增強(qiáng)問(wèn)答測(cè)試中得分 88.1。

模型IFEvalBFCL-v3 (Overall)BFCL-v3 (MultiTurn)TAU-Bench (Retail)TAU-Bench (Airline)SimpleQAHotpotQAQwen2.5-Max85.650.930.558.322.079.052.8GPT-4o-112081.969.641.062.846.082.863.9DeepSeek-V3-032483.466.235.860.732.482.654.6DeepSeek-R184.357.512.433.037.383.963.1GLM-4-32B-041487.669.641.568.751.288.163.8

代碼修復(fù)方面，GLM-4 在 SWE-bench 測(cè)試中的成功率達(dá) 33.8%。采用 MIT 許可的 GLM-4 降低了計(jì)算成本，為研究和企業(yè)提供了高性能 AI 解決方案。

模型框架SWE-bench VerifiedSWE-bench Verified miniGLM-4-32B-0414Moatless[1]33.838.0GLM-4-32B-0414Agentless[2]30.734.0GLM-4-32B-0414OpenHands[3]27.228.0

附上參考地址

GLM-4-0414 系列模型

THUDM Releases GLM 4: A 32B Parameter Model Competing Head-to-Head with GPT-4o and DeepSeek-V3

本文鏈接：http://www.rrqrq.com/showinfo-45-12317-0.html智譜發(fā)布新一代開源 AI 模型 GLM-4-32B-0414 系列，效果比肩 GPT 系列和 DeepSeek-V3 R1

聲明：本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：[email protected]

上一篇：人工智能開發(fā)平臺(tái) Hugging Face 收購(gòu) Pollen Robotics，進(jìn)軍人形機(jī)器人市場(chǎng)

下一篇：真·質(zhì)之選：北京現(xiàn)代OE四驅(qū)，讓安全與舒適超越配置堆砌

標(biāo)簽：

熱門焦點(diǎn)

新周期，誰(shuí)在堅(jiān)守窄門？

來(lái)源：錦緞今日的投資者恐怕已經(jīng)忘記了，在OpenAI創(chuàng)造出ChatGPT這一殺器的前夜，生成式AI也曾經(jīng)是一道窄門，窄到連馬斯克都差點(diǎn)失去了信心。在當(dāng)時(shí)的輿論眼中，AGI的道路不夠性感，不夠
關(guān)于ChatGPT的10點(diǎn)思考

作者：晏濤三壽近日ChatGPT又有大動(dòng)作。5月19日，OpenAI在官網(wǎng)宣布正式發(fā)布App應(yīng)用，并登錄蘋果應(yīng)用商店。與網(wǎng)頁(yè)版的聊天機(jī)器人相比，iOS應(yīng)用程序的發(fā)布有望讓更多人接觸到ChatGPT
茅臺(tái)的元宇宙App火了，也被罵慘了

元宇宙從概念走向大眾生活，并不是一件簡(jiǎn)單的事情。技術(shù)、世界觀、填充內(nèi)容、載體形式，每一個(gè)環(huán)節(jié)都需要層層疊疊的邏輯。但正如賽博朋克奠基人威廉·吉布
如何對(duì)一款 NFT 項(xiàng)目進(jìn)行價(jià)值評(píng)估？

原文作者 | Othmane Senhaji Rhazi，Web 3 企業(yè)家.編譯整理 | 黑米@白澤研究院我之所以成為一位大力倡導(dǎo) Web3 和 NFT 領(lǐng)域的企業(yè)家，因?yàn)槲蚁嘈盼覀冋谝娮C社會(huì)
元宇宙是推動(dòng)NFT發(fā)展的初始家園

現(xiàn)在大家都知道了什么是NFT，但好像離自己的生活還有一定距離。隨著我們與NFT 接觸增加，該如何將這些數(shù)字資產(chǎn)帶入我們的日常生活？NFT還是主流嗎？如果我們將“主流
音樂(lè)NFT平臺(tái)里的下一匹黑馬是誰(shuí)？

NFT 銷售額在 2021 年開始暴漲，從 2018 年的僅 4069 萬(wàn)美元的交易量，到 2021 年，NFT 交易量飆升至 442 億美元以上，并不斷刷新記錄并達(dá)到新的高度。預(yù)測(cè)到2025 年N
MR——元宇宙平臺(tái)的下一代入口

作為“元宇宙”的領(lǐng)頭羊，Meta的一舉一動(dòng)都受到業(yè)內(nèi)的高度關(guān)注。華爾街見聞提及，2月17日周四，F(xiàn)acebook母公司Meta在透露，其混合現(xiàn)實(shí)技術(shù)（MR）將在幾年后實(shí)現(xiàn)，讓人們對(duì)元
冬奧會(huì)數(shù)字收藏品升溫，市場(chǎng)再現(xiàn)“一墩難求”

根據(jù)公開信息顯示，國(guó)際奧委會(huì)官方授權(quán)的冰墩墩數(shù)字盲盒于北京時(shí)間2月12日凌晨在nWayPlay平臺(tái)發(fā)售，總數(shù)為500個(gè)，每個(gè)99美元，每人限購(gòu)5個(gè)。此外，不同的奧運(yùn)徽章數(shù)字藏
這場(chǎng)虛擬發(fā)布會(huì)，當(dāng)面“造假”！

英偉達(dá)去年4月份那場(chǎng)發(fā)布會(huì)，你曾看出什么不對(duì)勁的地方嗎？你品，你細(xì)品——在計(jì)算機(jī)圖形學(xué)頂會(huì)SIGGRAPH 2021上，英偉達(dá)通過(guò)一部紀(jì)錄片自曝：那場(chǎng)發(fā)布會(huì)內(nèi)藏玄機(jī)~你看到

国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美日韩国产一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

首頁(yè)

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

智譜發(fā)布新一代開源 AI 模型 GLM-4-32B-0414 系列，效果比肩 GPT 系列和 DeepSeek-V3 R1

新周期，誰(shuí)在堅(jiān)守窄門？

關(guān)于ChatGPT的10點(diǎn)思考

茅臺(tái)的元宇宙App火了，也被罵慘了

如何對(duì)一款 NFT 項(xiàng)目進(jìn)行價(jià)值評(píng)估？

元宇宙是推動(dòng)NFT發(fā)展的初始家園

音樂(lè)NFT平臺(tái)里的下一匹黑馬是誰(shuí)？

MR——元宇宙平臺(tái)的下一代入口

冬奧會(huì)數(shù)字收藏品升溫，市場(chǎng)再現(xiàn)“一墩難求”

這場(chǎng)虛擬發(fā)布會(huì)，當(dāng)面“造假”！

最新推薦

搶先推出“元宇宙”飲料，可口可樂(lè)贏麻了

在數(shù)字世界再造世界杯，元宇宙體育正變得越來(lái)越豐滿

一個(gè)視頻漲粉百萬(wàn)，柳夜熙們能成為元宇宙的“船票”嗎？

中文在線的“元宇宙”故事，資本聽膩了？

NFT高玩必備：NFT分析工具大盤點(diǎn)

爆發(fā)在即的Layer2賽道百花齊放，誰(shuí)將是領(lǐng)跑者？

猜你喜歡

熱門推薦

相關(guān)資訊