當(dāng)前位置：首頁 > 元宇宙 > AI

DeepSeek R1 Preview 模型亮相，代碼能力與 OpenAI o1 相當(dāng)且確認(rèn)開源

來源：責(zé)編：時(shí)間：2025-01-21 12:16:57 201觀看

導(dǎo)讀 DeepSeek 版 o1，有消息了。還未正式發(fā)布，已在代碼基準(zhǔn)測(cè)試 LiveCodeBench 霸榜前三，表現(xiàn)與 OpenAI o1 的中檔推理設(shè)置相當(dāng)。注意了，這不是在 DeepSeek 官方 App 已經(jīng)能試玩的 DeepSeek-R1-Lite-Preview（輕量預(yù)覽版

DeepSeek 版 o1，有消息了。

還未正式發(fā)布，已在代碼基準(zhǔn)測(cè)試 LiveCodeBench 霸榜前三，表現(xiàn)與 OpenAI o1 的中檔推理設(shè)置相當(dāng)。

注意了，這不是在 DeepSeek 官方 App 已經(jīng)能試玩的 DeepSeek-R1-Lite-Preview（輕量預(yù)覽版）。

而是摘掉了輕量版的帽子，稱為 DeepSeek-R1-Preview（預(yù)覽版），意味著替換了規(guī)模更大的基礎(chǔ)模型。

LiveCodeBench 團(tuán)隊(duì)透露，他們正在與 DeepSeek 合作評(píng)估新模型的能力，在合作過程中，DeepSeek 團(tuán)隊(duì)還幫他們找出并解決了評(píng)分系統(tǒng)的一些 bug。

與此同時(shí)，他們還曬出了目前僅有的一張 DeepSeek-R1-Preview 的思考過程。

鑒于 DeepSeek 此前已宣布 R1 模型將開源，有網(wǎng)友表示，與 OpenAI o1 編程能力相當(dāng)?shù)拈_源模型即將發(fā)布，2025 年的編程就只剩下按 Tab 鍵了。

DeepSeek 推理大模型滿血版

兩個(gè)月前，DeepSeek 在官網(wǎng)上線 DeepSeek-R1-Lite-Preview 時(shí)曾透露：

DeepSeek-R1-Lite-Preview 使用強(qiáng)化學(xué)習(xí)訓(xùn)練，推理含大量反思和驗(yàn)證，遵循新的 Scaling Laws——推理越長，表現(xiàn)越強(qiáng)。

在 AIME 測(cè)試基準(zhǔn)中，隨著推理長度的增加，DeepSeek-R1-Lite-Preview 表現(xiàn)出穩(wěn)定的得分提升。

DeepSeek-R1-Lite 推理的特點(diǎn)在網(wǎng)友們的后續(xù)測(cè)試中也得到了驗(yàn)證：

在某些情況下，模型似乎能夠在生成推理步驟時(shí)自我糾正，表現(xiàn)出類似原生“自我反思”的能力。不過，沒有訓(xùn)練數(shù)據(jù)、模型架構(gòu)和技術(shù)報(bào)告 / 論文的細(xì)節(jié)，很難確認(rèn)這一點(diǎn)。

期待未來的開源模型和 API！

摘掉 Lite 的帽子，變成 DeepSeek-R1-Preview，意味著換了更大的基礎(chǔ)模型。

之前 Lite 版就在難度較高數(shù)學(xué)和代碼任務(wù)上超越 o1-preview，大幅領(lǐng)先 GPT-4o。

這次在 LiveCodeBench 上，這次的 DeepSeek-R1-Preview 的表現(xiàn)又與 OpenAI o1-Medium 相當(dāng)，網(wǎng)友們更加期待開源模型和 API 了。

LiveCodeBench 由 UC 伯克利、MIT 和康奈爾大學(xué)團(tuán)隊(duì)推出，旨在對(duì)大模型的代碼能力進(jìn)行全面且無污染的評(píng)估。

具體避免測(cè)試數(shù)據(jù)泄露的方法，是隨著時(shí)間的推移不斷從人類的編程競(jìng)賽平臺(tái)收集新的題目。

除了代碼生成，還會(huì)評(píng)估模型在代碼自修復(fù)、執(zhí)行和測(cè)試輸出預(yù)測(cè)等方面的能力。這樣實(shí)時(shí)更新、確保公平性和可靠性的測(cè)試方法，獲得了開發(fā)者社區(qū)的認(rèn)可。

還有程序猿喊話 Cursor 直接把 R1-Preview 集成到 Agent mode 里：

One More Thing

趕在春節(jié)前，許多還在做訓(xùn)練的國產(chǎn)大模型團(tuán)隊(duì)，都把自家模型更新了一遍。OpenAI 似乎要趁這邊放假開始搞事情了（狗頭），阿爾特曼發(fā)帖透露：

o3-mini 完成外部合作測(cè)試，已確定最終版，將在幾周內(nèi)推出，會(huì)同時(shí)上線 API 和 ChatGPT。

在后續(xù)對(duì)話中，阿爾特曼還確認(rèn)了未來模型更多基本情況：

o3-mini 的速度會(huì)非常快

o3-mini 大多數(shù)情況下不如 o1-pro

o3 pro 收費(fèi)從 $200 / 月起步

OpenAI 正在關(guān)注如何讓 AI 一次性輸出更多內(nèi)容

2025 年計(jì)劃把 GPT 系列和 o 系列合并

本文來自微信公眾號(hào)：量子位（ID：QbitAI），作者：夢(mèng)晨、西風(fēng)，原標(biāo)題《DeepSeek 新模型霸榜，代碼能力與 OpenAI o1 相當(dāng)且確認(rèn)開源，網(wǎng)友：今年編程只剩 Tab 鍵》

本文鏈接：http://www.rrqrq.com/showinfo-45-9490-0.htmlDeepSeek R1 Preview 模型亮相，代碼能力與 OpenAI o1 相當(dāng)且確認(rèn)開源

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：[email protected]

上一篇：特斯拉人形機(jī)器人背后有“人”？遠(yuǎn)程操控真相待解

下一篇：我國將建立基于大數(shù)據(jù)和 AI 支持的教育評(píng)價(jià)和科學(xué)決策制度，建立全國學(xué)生心理健康監(jiān)測(cè)預(yù)警系統(tǒng)

標(biāo)簽：

熱門焦點(diǎn)

雷克薩斯高管，“受賄”5000萬？

來源：毒舌科技作者：潘磊雷克薩斯的高管，好像出事了。五六家日本小媒體，突然曝出了一個(gè)與中國市場(chǎng)有關(guān)的大新聞——雷克薩斯中國區(qū)一個(gè)高管受賄10億日元（約合人民幣5000
韓國主權(quán)基金增加對(duì)硅谷初創(chuàng)公司投資押注元宇宙和人工智能

韓國投資公司(KIC)CEO Seoungho Jin預(yù)計(jì)，該公司在舊金山的辦事處今年將擴(kuò)招人手，探索在硅谷投資科技、健康和綠色項(xiàng)目。規(guī)模高達(dá)2000億美元的韓國主權(quán)財(cái)富基金—
2022年中國元宇宙系列報(bào)告：底層架構(gòu)研究：虛擬引擎，擎動(dòng)未來

“虛擬引擎是元宇宙平臺(tái)搭建的基本工具。在這樣的條件下，虛擬引擎擁有了廣闊的市場(chǎng)空間。也需要虛擬引擎擁有擁有強(qiáng)大的處理能力，能夠高效快速的實(shí)現(xiàn)大量交互場(chǎng)
「國產(chǎn)良心」NFT嘲諷了誰？

2月23日，一個(gè)名為「國產(chǎn)良心」的NFT項(xiàng)目被許多活躍的加密用戶注意到。該項(xiàng)目的官網(wǎng)風(fēng)格尤為「不正經(jīng)」，它絲毫沒有避諱自己的小作坊出身，還將「中國人不騙中國人
小眾有趣NFT藝術(shù)作品欣賞（1）

隨著NFT發(fā)展火熱，越來越多領(lǐng)域與NFT融合，NFT藝術(shù)在加密領(lǐng)域中占據(jù)了很大一部分。NFT藝術(shù)與傳統(tǒng)藝術(shù)有相似之處，也有完全不同的地方。NFT藝術(shù)與傳統(tǒng)藝術(shù)一樣，表現(xiàn)了
知識(shí)產(chǎn)權(quán)可能在元宇宙中“消失”？

開篇老雅痞先來劃重點(diǎn)：一些公司開始采取積極的方式來保護(hù)他們?cè)谠钪娴闹R(shí)產(chǎn)權(quán)。耐克、愛馬仕和米拉麥克斯最近提起訴訟，聲稱NFT侵犯了他們的知識(shí)產(chǎn)權(quán)。Inside
FTX 加密貨幣交易所開始向游戲公司提供加密服務(wù)

據(jù)媒體報(bào)道，業(yè)內(nèi)領(lǐng)先的加密貨幣交易所FTX宣布將涉足游戲領(lǐng)域。該公司表示，計(jì)劃推出自己的游戲部門作為中介，專注于為傳統(tǒng)游戲公司提供加密相關(guān)服務(wù)。此舉將有助于
元宇宙收割了誰

作者：曉宇資本將元宇宙看作下一代互聯(lián)網(wǎng)的門票，畫大餅、割韭菜就成了一大選項(xiàng)。2021年被稱為元宇宙元年。在這一年里，先是號(hào)稱元宇宙第一股的沙盒游戲Roblox盛裝
虛擬偶像行業(yè)的商用價(jià)值逐漸凸顯，IP生態(tài)圈也逐漸成型

六月的第一個(gè)周六，一場(chǎng)虛擬偶像七海Nana7mi的個(gè)人3D演唱會(huì)在萬代南夢(mèng)宮上海文化中心舉行，相較于洛天依、百大UP主泠鳶yousa等，這位虛擬Up主在B站上的粉絲數(shù)43.6萬

国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美日韩国产一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

DeepSeek R1 Preview 模型亮相，代碼能力與 OpenAI o1 相當(dāng)且確認(rèn)開源

雷克薩斯高管，“受賄”5000萬？

韓國主權(quán)基金增加對(duì)硅谷初創(chuàng)公司投資押注元宇宙和人工智能

2022年中國元宇宙系列報(bào)告：底層架構(gòu)研究：虛擬引擎，擎動(dòng)未來

「國產(chǎn)良心」NFT嘲諷了誰？

小眾有趣NFT藝術(shù)作品欣賞（1）

知識(shí)產(chǎn)權(quán)可能在元宇宙中“消失”？

FTX 加密貨幣交易所開始向游戲公司提供加密服務(wù)

元宇宙收割了誰

虛擬偶像行業(yè)的商用價(jià)值逐漸凸顯，IP生態(tài)圈也逐漸成型

最新推薦

“虛擬人”角斗場(chǎng)，基于“硬實(shí)力”下的人性平衡法則？

從英式拍到荷蘭拍，看傳統(tǒng)金融拍賣玩法如何玩轉(zhuǎn)NFT市場(chǎng)交易

費(fèi)城藝術(shù)家使用區(qū)塊鏈，在數(shù)字藝術(shù)中狠狠撈一筆

a16z：元宇宙辦公會(huì)取代實(shí)體辦公室嗎？

對(duì)諷刺無動(dòng)于衷，Nori將碳市場(chǎng)放在區(qū)塊鏈上

音樂家如何利用NFTs來提高歌迷參與度

猜你喜歡

熱門推薦

相關(guān)資訊

DeepSeek R1 Preview 模型亮相，代碼能力與 OpenAI o1 相當(dāng)且確認(rèn)開源

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊

DeepSeek R1 Preview 模型亮相，代碼能力與 OpenAI o1 相當(dāng)且確認(rèn)開源