當(dāng)前位置：首頁 > 元宇宙 > AI

英偉達(dá)推出 OpenReasoning-Nemotron 推理模型，普通游戲電腦也能玩轉(zhuǎn)高級推理

來源：責(zé)編：時間：2025-07-23 12:19:24 98觀看

導(dǎo)讀 7 月 20 日消息，英偉達(dá)今日推出了全新推理模型套件 OpenReasoning-Nemotron。該套件包含四個基于 Qwen-2.5 微調(diào)的模型，參數(shù)規(guī)模分別為 1.5B、7B、14B 和 32B，全部源自 6710 億參數(shù)的 DeepSeek R1 0528 大模型。

7 月 20 日消息，英偉達(dá)今日推出了全新推理模型套件 OpenReasoning-Nemotron。該套件包含四個基于 Qwen-2.5 微調(diào)的模型，參數(shù)規(guī)模分別為 1.5B、7B、14B 和 32B，全部源自 6710 億參數(shù)的 DeepSeek R1 0528 大模型。通過“蒸餾”這一過程，英偉達(dá)成功將這一超大規(guī)模模型壓縮成更輕量的推理模型，降低了部署門檻，使得即使在標(biāo)準(zhǔn)游戲電腦上也能進行高級推理實驗，避免了高昂的 GPU 與云計算成本。

據(jù)了解，英偉達(dá)此次模型的核心優(yōu)勢并非在于訓(xùn)練手段的復(fù)雜創(chuàng)新，而是依托強大的數(shù)據(jù)支撐。公司利用 NeMo Skills 生成了 500 萬個涵蓋數(shù)學(xué)、科學(xué)與編程的解答數(shù)據(jù)集，并通過純監(jiān)督學(xué)習(xí)方式對模型進行微調(diào)。經(jīng)測試，32B 模型在 AIME24 數(shù)學(xué)競賽中獲得 89.2 分，在 HMMT 2 月賽中達(dá)到 73.8 分，甚至最小的 1.5B 模型也分別拿下 55.5 和 31.5 分，展現(xiàn)出良好的推理與解題能力。

英偉達(dá)將 OpenReasoning-Nemotron 定位為科研探索的有力工具，四個模型的完整檢查點將在 Hugging Face 開放下載，便于研究人員基于此進行強化學(xué)習(xí)等進一步實驗，或針對特定任務(wù)定制優(yōu)化。同時，模型支持“GenSelect 模式”，即每個問題可生成多種解答版本，通過篩選最優(yōu)解來提升準(zhǔn)確率。在該模式下，32B 模型在多項數(shù)學(xué)與編程基準(zhǔn)測試中已達(dá)到甚至超越 OpenAI o3-high 的表現(xiàn)。

值得一提的是，英偉達(dá)此次模型訓(xùn)練全程未引入強化學(xué)習(xí)，僅采用監(jiān)督微調(diào)，為社區(qū)提供了干凈且處于技術(shù)前沿的起點，便于未來開展強化學(xué)習(xí)相關(guān)研究。對于擁有高性能游戲 GPU 的玩家及個人開發(fā)者而言，這套模型讓本地運行接近業(yè)界最先進水平的推理模型成為現(xiàn)實。

本文鏈接：http://www.rrqrq.com/showinfo-45-14790-0.html英偉達(dá)推出 OpenReasoning-Nemotron 推理模型，普通游戲電腦也能玩轉(zhuǎn)高級推理

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：消息稱 Meta 超級智能實驗室已招募 44 人：一半來自中國，40% 曾在 OpenAI 任職

下一篇：陶哲軒回應(yīng) OpenAI 新模型 IMO 奪金，GPT-5 測試版曝光

標(biāo)簽：

熱門焦點

歐盟人工智能法案：四種AI系統(tǒng)風(fēng)險類型的劃分及監(jiān)管措施

作者：趙志東蔡佳雯來源：區(qū)塊鏈日報該法案采用風(fēng)險分級的規(guī)制路徑，將人工智能系統(tǒng)的風(fēng)險劃分成不可接受的風(fēng)險、高風(fēng)險、有限風(fēng)險和輕微風(fēng)險四種類型，并針對不同類型施加了不同
《從營銷AIGC化到AIGC營銷化》報告發(fā)布

來源：清元宇宙7月2日上午，清華大學(xué)元宇宙文化實驗室舉辦元宇宙在線沙龍“AIGC熱潮與應(yīng)用”。會議中，清華大學(xué)新聞與傳播學(xué)院教授、元宇宙文化實驗室主任、新媒體研究
“平均時代”：ChatGPT模仿秀的隱喻

來源：錦緞如果你問ChatGPT，Instagram上最美的女人是誰？它很可能會給你一個名字，叫卡戴珊。如果你觀察過Instagram這個美版小紅書：平臺上的所有網(wǎng)紅，展現(xiàn)的幾乎是統(tǒng)一面孔：統(tǒng)一的醫(yī)
米哈游推出元宇宙品牌；VR/AR老牌企業(yè)當(dāng)紅齊天完成B輪+融資

今日熱點：蘋果AR/VR頭顯的FaceTime或基于Memojis和SharePlay構(gòu)建而成；VR/AR老牌企業(yè)當(dāng)紅齊天完成B輪+融資；米哈游推出元宇宙品牌HoYoverse；國產(chǎn)VR射擊游戲《Contra
冰墩墩NFT遇冷，價格跌80%，日成交僅3筆。

“兩日上漲千倍”并不存在，且冰墩墩NFT的市場熱度遠(yuǎn)不及社交媒體所稱的那樣高。2月11日，獲得國際奧委會授權(quán)的2022冬奧會吉祥物冰墩墩相關(guān)NFT產(chǎn)品在nWayPlay上線
2021年中國智慧城市行業(yè)概覽：AI慧眼獨具，賦能“雙碳”目標(biāo)

中國智慧城市試點項目主要集中于東南地區(qū)以及華中地區(qū)，受制于應(yīng)用場景分散以及行業(yè)地域建設(shè)差異，目前中國智慧城市存在較多弊端，未來數(shù)量有望持續(xù)突破。中國智慧
傳統(tǒng)互聯(lián)網(wǎng)與區(qū)塊鏈場景下數(shù)據(jù)權(quán)利法律分析

數(shù)據(jù)權(quán)益的復(fù)雜性在于數(shù)據(jù)涉及多環(huán)節(jié)多主體、內(nèi)容不同質(zhì)且與不同場景緊密聯(lián)系、對軟硬件技術(shù)環(huán)節(jié)緊密相關(guān)等方面的復(fù)雜性。在傳統(tǒng)互聯(lián)網(wǎng)與區(qū)塊鏈模式下，數(shù)據(jù)處
扎克伯格演示了一種“造物主”式的元宇宙語音機器人工具

前身為Facebook的Meta公司今天展示了一個人工智能系統(tǒng)的Demo，該系統(tǒng)使人們能夠通過語音命令生成或?qū)胩摂M世界中的事物。該公司認(rèn)為這個被稱為 "Builder Bot "
初探元宇宙

2021年可以被稱為“元宇宙”元年。繼2021年3月沙盒游戲平臺Roblox將“元宇宙”概念放入招股書中，被稱為“元宇宙”第一股后，F(xiàn)acebook更名為Meta, 引發(fā)全球范圍內(nèi)

国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美日韩国产一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

英偉達(dá)推出 OpenReasoning-Nemotron 推理模型，普通游戲電腦也能玩轉(zhuǎn)高級推理

歐盟人工智能法案：四種AI系統(tǒng)風(fēng)險類型的劃分及監(jiān)管措施

《從營銷AIGC化到AIGC營銷化》報告發(fā)布

“平均時代”：ChatGPT模仿秀的隱喻

米哈游推出元宇宙品牌；VR/AR老牌企業(yè)當(dāng)紅齊天完成B輪+融資

冰墩墩NFT遇冷，價格跌80%，日成交僅3筆。

2021年中國智慧城市行業(yè)概覽：AI慧眼獨具，賦能“雙碳”目標(biāo)

傳統(tǒng)互聯(lián)網(wǎng)與區(qū)塊鏈場景下數(shù)據(jù)權(quán)利法律分析

扎克伯格演示了一種“造物主”式的元宇宙語音機器人工具

初探元宇宙

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊