當(dāng)前位置：首頁(yè) > 元宇宙 > AI

合成數(shù)據(jù)助力，谷歌等大模型數(shù)學(xué)推理能力突飛猛進(jìn)！

來(lái)源：責(zé)編：時(shí)間：2025-04-07 10:34:46 188觀看

導(dǎo)讀近期，一項(xiàng)關(guān)于合成數(shù)據(jù)在大型模型訓(xùn)練中應(yīng)用的新研究成果引起了業(yè)界的廣泛關(guān)注。這項(xiàng)研究由谷歌、卡內(nèi)基梅隆大學(xué)和MultiOn的聯(lián)合研究團(tuán)隊(duì)共同完成。據(jù)Epoch AI的研究報(bào)告顯示，盡管全球范圍內(nèi)已有約300萬(wàn)億個(gè)高質(zhì)量的文

近期，一項(xiàng)關(guān)于合成數(shù)據(jù)在大型模型訓(xùn)練中應(yīng)用的新研究成果引起了業(yè)界的廣泛關(guān)注。這項(xiàng)研究由谷歌、卡內(nèi)基梅隆大學(xué)和MultiOn的聯(lián)合研究團(tuán)隊(duì)共同完成。

據(jù)Epoch AI的研究報(bào)告顯示，盡管全球范圍內(nèi)已有約300萬(wàn)億個(gè)高質(zhì)量的文本訓(xùn)練標(biāo)記可供使用，但隨著ChatGPT等大模型的快速發(fā)展，對(duì)訓(xùn)練數(shù)據(jù)的需求正呈爆炸式增長(zhǎng)。預(yù)測(cè)顯示，到2026年，現(xiàn)有的高質(zhì)量訓(xùn)練數(shù)據(jù)或?qū)o(wú)法滿足需求。因此，探索合成數(shù)據(jù)作為替代方案顯得尤為重要。

在此次研究中，研究人員主要聚焦于兩種類型的合成數(shù)據(jù)：正向數(shù)據(jù)和負(fù)向數(shù)據(jù)。正向數(shù)據(jù)由高性能大模型（例如GPT-4和Gemini 1.5 Pro）生成，提供正確的數(shù)學(xué)問(wèn)題解決方案，為模型提供學(xué)習(xí)范例。然而，單純依賴正向數(shù)據(jù)存在局限性，可能導(dǎo)致模型僅通過(guò)模式匹配學(xué)習(xí)，缺乏真正的理解能力，且在處理新問(wèn)題時(shí)泛化能力下降。

為了克服這些挑戰(zhàn)，研究人員引入了負(fù)向數(shù)據(jù)，即經(jīng)過(guò)驗(yàn)證的錯(cuò)誤問(wèn)題解決步驟。負(fù)向數(shù)據(jù)的加入有助于模型識(shí)別并避免錯(cuò)誤，從而提升其邏輯推理能力。盡管使用負(fù)向數(shù)據(jù)面臨諸多困難，如錯(cuò)誤步驟可能包含誤導(dǎo)性信息，但研究團(tuán)隊(duì)通過(guò)直接偏好優(yōu)化（DPO）方法成功使模型能夠從錯(cuò)誤中學(xué)習(xí)。

DPO方法為每個(gè)問(wèn)題解決步驟分配一個(gè)優(yōu)勢(shì)值，反映其相對(duì)于理想解決方案的價(jià)值。研究表明，高優(yōu)勢(shì)步驟是正確解決方案的關(guān)鍵，而低優(yōu)勢(shì)步驟則可能揭示模型推理中的問(wèn)題。借助這些優(yōu)勢(shì)值，模型能夠在強(qiáng)化學(xué)習(xí)框架內(nèi)動(dòng)態(tài)調(diào)整策略，更高效地從合成數(shù)據(jù)中學(xué)習(xí)和改進(jìn)。

為了驗(yàn)證合成數(shù)據(jù)的有效性，研究團(tuán)隊(duì)選擇了DeepSeek-Math-7B和LLaMa2-7B等模型，在GSM8K和MATH數(shù)據(jù)集上進(jìn)行了全面測(cè)試。測(cè)試結(jié)果顯示，經(jīng)過(guò)正向和負(fù)向合成數(shù)據(jù)預(yù)訓(xùn)練的大模型在數(shù)學(xué)推理任務(wù)上的性能實(shí)現(xiàn)了顯著提升，甚至達(dá)到了八倍的增長(zhǎng)。這一研究成果充分展示了合成數(shù)據(jù)在增強(qiáng)大模型邏輯推理能力方面的巨大潛力和實(shí)際應(yīng)用價(jià)值。

舉報(bào) 0收藏 0打賞 0評(píng)論 0

更多>同類資訊

中國(guó)“本源悟空”量子計(jì)算機(jī)，全球領(lǐng)跑十億參數(shù)AI大模型微調(diào)實(shí)戰(zhàn)

04-07

數(shù)智人力新基建：實(shí)時(shí)人才市場(chǎng)薪酬數(shù)據(jù)重構(gòu)企業(yè)用人戰(zhàn)略

在數(shù)字化轉(zhuǎn)型浪潮中，人力資源部門正從傳統(tǒng)的事務(wù)處理中心向戰(zhàn)略決策中心進(jìn)化。市場(chǎng)人才數(shù)據(jù)、薪酬數(shù)據(jù)和招聘數(shù)據(jù)構(gòu)成的黃金三角，正在重構(gòu)企業(yè)人才管理的底層邏輯。本文將從人力成本控制、定崗定薪優(yōu)化、競(jìng)品趨勢(shì)監(jiān)測(cè)三大維度，揭示數(shù)據(jù)驅(qū)動(dòng)型HR管理的戰(zhàn)略價(jià)值。一、市

04-07

深圳海關(guān)智能機(jī)器人大升級(jí)！DeepSeek-R1助力通關(guān)效率飆升

04-07

Meta新推Llama 4 AI模型，首秀“混合專家”架構(gòu)引領(lǐng)技術(shù)潮流

當(dāng)?shù)貢r(shí)間4月5日，Meta公司推出其AI模型Llama 4。Meta表示，Llama 4是一個(gè)多模態(tài)大模型，它能夠處理和整合各種類型的數(shù)據(jù)，包括文本、視頻、圖像和音頻，并且可以在這些格式之間轉(zhuǎn)換內(nèi)容。 Ll…

04-07

OpenAI與蘋果前設(shè)計(jì)總監(jiān)聯(lián)手打造AI新設(shè)備，或開啟智能穿戴新篇章？

04-07

創(chuàng)投秘籍：投資人眼中決定成敗的九大要素

一家共享出行企業(yè)在發(fā)展過(guò)程中，通過(guò)研究對(duì)標(biāo)公司的市場(chǎng)拓展策略，發(fā)現(xiàn)其在進(jìn)入新城市時(shí)，采用了與當(dāng)?shù)卣献鳌⑻峁﹥?yōu)惠政策吸引用戶等方式，快速打開了市場(chǎng)。在BP中，創(chuàng)業(yè)者要清晰闡述自身與對(duì)標(biāo)公司的差距及優(yōu)勢(shì)，展示…

04-07

廣西“路網(wǎng)先知”大顯身手，清明假期交通保障智慧升級(jí)！

04-06

《創(chuàng)：戰(zhàn)神》預(yù)告震撼來(lái)襲，AI覺醒未來(lái)都市，10月10日北美震撼上映！

04-06

《創(chuàng)：戰(zhàn)神》預(yù)告燃爆！10月10日，AI覺醒震撼來(lái)襲

04-06

全球風(fēng)投涌向AI，OpenAI與Meta競(jìng)賽，亞洲市場(chǎng)緣何低迷？

4月6日，Meta發(fā)布了Llama 4系列模型，是其首個(gè)原生多模態(tài)模型，最高1000萬(wàn)上下文長(zhǎng)度，訓(xùn)練數(shù)據(jù)高達(dá)30萬(wàn)億個(gè)Tokens，支持文本、圖像和視頻統(tǒng)一，可同時(shí)理解文本和圖片，進(jìn)行圖文推理、問(wèn)答、識(shí)別…

04-06

AMD Z2系列掌機(jī)CPU再添新成員：AI Z2 Extreme與Z2 A即將來(lái)襲！

04-06

微軟Copilot安卓版新動(dòng)向：MSN資訊整合，盈利與功能雙升級(jí)！

04-06

Meta重磅發(fā)布Llama 4，開源AI大模型再升級(jí)，能否引領(lǐng)新潮流？

04-06

廣西高速“路網(wǎng)先知”上線，清明出行擁堵提前半小時(shí)預(yù)知

04-06

廣西清明假期高速新招！AI+無(wú)人機(jī)聯(lián)動(dòng)治堵，出行更順暢

04-06

點(diǎn)擊查看更多 +

全站最新

小米15周年慶典，眾高管齊發(fā)聲：新起點(diǎn)，新征程，繼續(xù)努力！

小米Su7事件引熱議：新能源車安全底線何在？

余承東卸任車BU董事長(zhǎng)后首發(fā)聲：?jiǎn)柦鏜8小訂破10萬(wàn)，聚焦新方向？

本田Prelude雙門轎跑復(fù)活，2.0L混動(dòng)系統(tǒng)對(duì)決豐田86，2025年上市！

長(zhǎng)江產(chǎn)投建信投資等在湖北成立股權(quán)基金出資額6億

打工人必看！6萬(wàn)買插混車，五菱星光還是吉利？一算油費(fèi)差距大！

熱門內(nèi)容

某大廠大模型高管涉婚變，公司賬號(hào)停用引熱議
美團(tuán)等巨頭聯(lián)手投資硅基流動(dòng)，共筑生成式AI設(shè)施新藍(lán)圖
00后主播借AI工具DeepSeek，直播單日狂攬3.3億銷售額！
華為Pura X震撼發(fā)布：獨(dú)特“闊折疊”形態(tài)，售價(jià)7499元起引領(lǐng)新潮流！
立陶宛高校：學(xué)生不當(dāng)使用AI，學(xué)術(shù)不端遭開除
AI大模型時(shí)代，文科生將何去何從？
夸克全新升級(jí)：AI超級(jí)框，你的全能助手來(lái)了！
Ollama部署DeepSeek隱患多？騰云悅智安全實(shí)驗(yàn)室教你如何加固防護(hù)！
阿里新夸克AI超級(jí)框上線，能否撼動(dòng)騰訊元寶的AI入口地位？
英偉達(dá)推出DGX Spark與Station個(gè)人AI超算，Spark版售3000美元起
百度文心大模型4.5及X1正式發(fā)布，全面免費(fèi)開放，性能對(duì)標(biāo)國(guó)際前沿
315曝光信息黑洞后，遼寧云企智能科技經(jīng)營(yíng)異常被列入名錄
谷歌開源Gemma-3多模態(tài)大模型，性能強(qiáng)勁媲美業(yè)界頂尖
阿里新夸克：AI超級(jí)框能否引領(lǐng)移動(dòng)互聯(lián)網(wǎng)新入口？
比爾·蓋茨展望：AI將深度改造行業(yè)，人類生來(lái)不為工作？

本欄最新

中國(guó)“本源悟空”量子計(jì)算機(jī)，全球領(lǐng)跑十億參數(shù)AI大模型微調(diào)實(shí)戰(zhàn)

深圳海關(guān)智能機(jī)器人大升級(jí)！DeepSeek-R1助力通關(guān)效率飆升

廣西“路網(wǎng)先知”大顯身手，清明假期交通保障智慧升級(jí)！

《創(chuàng)：戰(zhàn)神》預(yù)告震撼來(lái)襲，AI覺醒未來(lái)都市，10月10日北美震撼上映！

《創(chuàng)：戰(zhàn)神》預(yù)告燃爆！10月10日，AI覺醒震撼來(lái)襲

全球風(fēng)投涌向AI，OpenAI與Meta競(jìng)賽，亞洲市場(chǎng)緣何低迷？

本文鏈接：http://www.rrqrq.com/showinfo-45-11994-0.html合成數(shù)據(jù)助力，谷歌等大模型數(shù)學(xué)推理能力突飛猛進(jìn)！

聲明：本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：[email protected]

上一篇： 2025家電新風(fēng)向：抖音引領(lǐng)行業(yè)變革，六大趨勢(shì)賽道預(yù)示生活新變革！

下一篇：中國(guó)“本源悟空”量子計(jì)算機(jī)，全球領(lǐng)跑十億參數(shù)AI大模型微調(diào)實(shí)戰(zhàn)

標(biāo)簽：

熱門焦點(diǎn)

一份全面清單：Web3行業(yè)高薪酬的13種工作

來(lái)源：區(qū)塊鏈騎士這可能會(huì)讓許多人感到震驚，但除了成為開發(fā)人員之外，Web3還有其他高薪工作。Web3可能是現(xiàn)代就業(yè)市場(chǎng)中跨學(xué)科最多的領(lǐng)域，換句話說(shuō)，它由許多個(gè)在不同領(lǐng)域中具有不同
內(nèi)容行業(yè)大變天，爆款全靠AI？

出品 | 微果醬（wjam123456）作者 | 陳出木題圖 | 文心一格 AI的發(fā)展之快出乎所有人的預(yù)料，似乎一夜之間便呼嘯而來(lái)。無(wú)論是資本的風(fēng)向標(biāo)，抑或是生活工作的輔助、流量口，還是茶余飯
中國(guó)虛擬數(shù)字人如何橫向拓展市場(chǎng)需求，探索發(fā)展場(chǎng)景?

通過(guò)5G、AI等新技術(shù)更新?lián)Q代，虛擬數(shù)字人為諸多下游行業(yè)帶來(lái)新的發(fā)展機(jī)會(huì)。虛擬數(shù)字人技術(shù)以其簡(jiǎn)化性和精品性持續(xù)拓展泛娛樂、金融、教育、政務(wù)、醫(yī)療、零售等
銀保監(jiān)會(huì)：打擊以“元宇宙”為名義的違法行為

今日，銀保監(jiān)會(huì)發(fā)布《關(guān)于防范以“元宇宙”名義進(jìn)行非法集資的風(fēng)險(xiǎn)提示》，全文如下：近期，一些不法分子蹭熱點(diǎn)，以“元宇宙投資項(xiàng)目”“元宇宙鏈游”等名目吸收資金，涉
2021年中國(guó)元宇宙行業(yè)用戶行為分析熱點(diǎn)報(bào)告

元宇宙網(wǎng)絡(luò)熱度高漲，中國(guó)網(wǎng)民對(duì)虛擬生態(tài)興趣濃厚。艾媒咨詢數(shù)據(jù)顯示，超六成的網(wǎng)民對(duì)“元宇宙”了解程度較高，在元宇宙較基礎(chǔ)的游戲領(lǐng)域，超九成的人對(duì)VR游戲更感興
「國(guó)產(chǎn)良心」NFT嘲諷了誰(shuí)？

2月23日，一個(gè)名為「國(guó)產(chǎn)良心」的NFT項(xiàng)目被許多活躍的加密用戶注意到。該項(xiàng)目的官網(wǎng)風(fēng)格尤為「不正經(jīng)」，它絲毫沒有避諱自己的小作坊出身，還將「中國(guó)人不騙中國(guó)人
就業(yè)年齡歧視如何解決？來(lái)Web3看看

上周，我突然想到我的第一份工作實(shí)際上是在為一家失敗的航空公司制定破產(chǎn)退出計(jì)劃，那年我們的協(xié)議實(shí)習(xí)生剛出生。在一陣恐慌后，我又花了一點(diǎn)時(shí)間反思我這個(gè)擁有近1
知識(shí)產(chǎn)權(quán)可能在元宇宙中“消失”？

開篇老雅痞先來(lái)劃重點(diǎn)：一些公司開始采取積極的方式來(lái)保護(hù)他們?cè)谠钪娴闹R(shí)產(chǎn)權(quán)。耐克、愛馬仕和米拉麥克斯最近提起訴訟，聲稱NFT侵犯了他們的知識(shí)產(chǎn)權(quán)。Inside
利用元宇宙平臺(tái)10天收入160萬(wàn)，風(fēng)口還是虎口？

美國(guó)Meta平臺(tái)有限公司，也就是原來(lái)的臉書公司，9日宣布，公司旗下的虛擬現(xiàn)實(shí)應(yīng)用《地平線世界》正式向美國(guó)和加拿大的18歲以上人群開放。這也是目前Meta推出的最具象

国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美日韩国产一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

首頁(yè)

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

合成數(shù)據(jù)助力，谷歌等大模型數(shù)學(xué)推理能力突飛猛進(jìn)！

一份全面清單：Web3行業(yè)高薪酬的13種工作

內(nèi)容行業(yè)大變天，爆款全靠AI？

中國(guó)虛擬數(shù)字人如何橫向拓展市場(chǎng)需求，探索發(fā)展場(chǎng)景?

銀保監(jiān)會(huì)：打擊以“元宇宙”為名義的違法行為

2021年中國(guó)元宇宙行業(yè)用戶行為分析熱點(diǎn)報(bào)告

「國(guó)產(chǎn)良心」NFT嘲諷了誰(shuí)？

就業(yè)年齡歧視如何解決？來(lái)Web3看看

知識(shí)產(chǎn)權(quán)可能在元宇宙中“消失”？

利用元宇宙平臺(tái)10天收入160萬(wàn)，風(fēng)口還是虎口？

最新推薦

AI界地震！美國(guó)對(duì)OpenAI展開調(diào)查！監(jiān)管風(fēng)暴來(lái)襲！

虛擬人再升級(jí)，企業(yè)可以解放雙手了？

關(guān)于年度熱詞NFT，除了錢，我們還可以聊點(diǎn)啥？

NFT藝術(shù)家Hayley Rincon 專訪：我的迷幻數(shù)字藝術(shù)之路

扎克伯格演示了一種“造物主”式的元宇宙語(yǔ)音機(jī)器人工具

這個(gè)好萊塢影視制作公司涉足NFT，讓持有者在制作中發(fā)揮作用

猜你喜歡

熱門推薦

相關(guān)資訊