當(dāng)前位置：首頁(yè) > 元宇宙 > AI

大模型“自動(dòng)修 bug”能力將提升，豆包團(tuán)隊(duì)開源首個(gè)多語(yǔ)言代碼修復(fù)基準(zhǔn) Multi-SWE-bench

來(lái)源：責(zé)編：時(shí)間：2025-04-13 08:41:48 133觀看

導(dǎo)讀 4 月 10 日消息，豆包大模型團(tuán)隊(duì)今日通過(guò)官方公眾號(hào)宣布，首個(gè)多語(yǔ)言類 SWE 數(shù)據(jù)集 Multi-SWE-bench 現(xiàn)已正式開源，可用于評(píng)估和提升大模型“自動(dòng)修 Bug”能力。在 SWE-bench 基礎(chǔ)上，Multi-SWE-bench 首次覆蓋 Pyth

4 月 10 日消息，豆包大模型團(tuán)隊(duì)今日通過(guò)官方公眾號(hào)宣布，首個(gè)多語(yǔ)言類 SWE 數(shù)據(jù)集 Multi-SWE-bench 現(xiàn)已正式開源，可用于評(píng)估和提升大模型“自動(dòng)修 Bug”能力。

在 SWE-bench 基礎(chǔ)上，Multi-SWE-bench 首次覆蓋 Python 之外的 7 種主流編程語(yǔ)言，是真正面向“全棧工程”的評(píng)測(cè)基準(zhǔn)。其數(shù)據(jù)均來(lái)自 GitHub issue，歷時(shí)近一年構(gòu)建，以盡可能準(zhǔn)確測(cè)評(píng)和提高大模型高階編程智能水平。

Multi-SWE-bench 旨在推動(dòng)自動(dòng)編程技術(shù)從僅能解決單一語(yǔ)言（如 Python）和低復(fù)雜度的任務(wù)，朝著支持多語(yǔ)言、具備真實(shí)問題解決能力的通用型智能體邁進(jìn)。

SWE-bench 是當(dāng)前最具代表性的代碼修復(fù)評(píng)測(cè)基準(zhǔn)，強(qiáng)調(diào)任務(wù)真實(shí)、難度高。它基于 GitHub issue，要求模型自動(dòng)定位并修復(fù) Bug，兼具跨文件修改、復(fù)雜語(yǔ)義推理與上下文理解等挑戰(zhàn)。

Multi-SWE-bench 旨在補(bǔ)全現(xiàn)有同類基準(zhǔn)語(yǔ)言覆蓋方面的不足，系統(tǒng)性評(píng)估大模型在復(fù)雜開發(fā)環(huán)境下的“多語(yǔ)言泛化能力”，推動(dòng)多語(yǔ)言軟件開發(fā) Agent 的評(píng)估與研究，其主要特性如下：

首次覆蓋 7 種主流編程語(yǔ)言（包括 Java、Go、Rust、C、C++、TypeScript、JavaScript），構(gòu)建多語(yǔ)言開發(fā)環(huán)境下的代碼修復(fù)任務(wù)，系統(tǒng)評(píng)估模型的跨語(yǔ)言適應(yīng)與泛化能力；

引入任務(wù)難度分級(jí)機(jī)制，將問題劃分為簡(jiǎn)單（Easy）、中等（Medium）和困難（Hard）三類，涵蓋從一行修改到多文件、多步驟、多語(yǔ)義依賴的開發(fā)挑戰(zhàn)；

1,632 個(gè)實(shí)例全部來(lái)源于真實(shí)開源倉(cāng)庫(kù)，并經(jīng)過(guò)統(tǒng)一的測(cè)試標(biāo)準(zhǔn)和專業(yè)開發(fā)者的審核篩選，確保每個(gè)樣本具備清晰的問題描述、正確的修復(fù)補(bǔ)丁以及可復(fù)現(xiàn)的運(yùn)行測(cè)試環(huán)境。

附開源鏈接：

Multi-SWE-bench: A Multilingual Benchmark for Issue Resolving：

論文鏈接：https://arxiv.org/ abs / 2504.02605

榜單鏈接：https://multi-swe-bench.github.io

代碼鏈接：https://github.com/ multi-swe-bench / multi-swe-bench

數(shù)據(jù)鏈接：https://huggingface.co/ datasets / ByteDance-Seed / Multi-SWE-bench

本文鏈接：http://www.rrqrq.com/showinfo-45-12213-0.html大模型“自動(dòng)修 bug”能力將提升，豆包團(tuán)隊(duì)開源首個(gè)多語(yǔ)言代碼修復(fù)基準(zhǔn) Multi-SWE-bench

聲明：本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：[email protected]

上一篇：優(yōu)音通信雙獎(jiǎng)加冕，智能通信創(chuàng)新引領(lǐng)行業(yè)未來(lái)！

下一篇：谷歌 Veo 2 升級(jí)可生成更具電影感視頻，文本、音頻 AI 同步升級(jí)

標(biāo)簽：

熱門焦點(diǎn)

元宇宙的文旅賽道，還能如何發(fā)力？

來(lái)源：X增強(qiáng)現(xiàn)實(shí)蘋果推出Vision Pro，為XR行業(yè)注入一劑強(qiáng)心針。而在蘋果開發(fā)者大會(huì)上迪士尼CEO鮑勃·艾格在宣布迪士尼與蘋果達(dá)成合作，其Disney+流媒體服務(wù)將于Vision Pro
元宇宙帶來(lái)沉浸式智能登錄？你學(xué)會(huì)了嗎？

備受資本市場(chǎng)寵愛的元宇宙概念，正掀起一番番波瀾。元宇宙作為虛實(shí)相融的互聯(lián)網(wǎng)應(yīng)用和社會(huì)形態(tài)，與沉浸式體驗(yàn)緊密相關(guān)。多重路徑，打造無(wú)感知沉浸式智能登錄《設(shè)計(jì)
Meta公布AI概念“Builder Bot”；銀保監(jiān)發(fā)布元宇宙相關(guān)風(fēng)險(xiǎn)提示

概述自從Meta在2月初公布財(cái)報(bào)后，其負(fù)責(zé)元宇宙的核心部門Reality Labs表現(xiàn)不佳，凈虧損超100億美元，隨后股價(jià)斷崖式下跌。如今，Meta開始繼續(xù)發(fā)力元宇宙，想要挽回頹勢(shì)，
NFT盜竊案：為什么NFT市場(chǎng)被盜竊和黑客所困擾？

Block-806NFT的增長(zhǎng)值得關(guān)注。許多人愿意為數(shù)字藝術(shù)支付數(shù)百萬(wàn)美元，世界正在走向數(shù)字化。報(bào)告顯示，NFT市場(chǎng)和NFT收藏從2020年的1.06億美元增加到了2021年的442億
元宇宙畫廊體驗(yàn)報(bào)告：有點(diǎn)頭疼。

2 月 10 日，Hrishi Rajasekar 在舊金山鑄幣廠的沉浸式 NFT 展覽 Verse 觀看增強(qiáng)現(xiàn)實(shí)藝術(shù)品。“我們現(xiàn)在在虛擬世界中嗎？時(shí)間好像變長(zhǎng)了” 我問身后排隊(duì)的人。我
在元宇宙開會(huì)是什么樣一種體驗(yàn)

空間就是一切還記得面對(duì)面的會(huì)議嗎？就在不久前，與會(huì)者需要飛到遙遠(yuǎn)的目的地，并進(jìn)行鼓舞人心的對(duì)話、網(wǎng)絡(luò)、免費(fèi)食物，甚至可能會(huì)有一兩個(gè)很好的小組討論。隨之而來(lái)
獨(dú)立故事片“Calladita”將使用 NFT 籌集資金

導(dǎo)演 Miguel Faus 正在轉(zhuǎn)向加密來(lái)資助他的處女作，由 Paula Grimaldo 和 Emily Mortimer 主演。“Calladita”（導(dǎo)演 Miguel Faus）。圖片：米格爾·福斯在過(guò)去的一年
知識(shí)產(chǎn)權(quán)可能在元宇宙中“消失”？

開篇老雅痞先來(lái)劃重點(diǎn)：一些公司開始采取積極的方式來(lái)保護(hù)他們?cè)谠钪娴闹R(shí)產(chǎn)權(quán)。耐克、愛馬仕和米拉麥克斯最近提起訴訟，聲稱NFT侵犯了他們的知識(shí)產(chǎn)權(quán)。Inside
3月份值得關(guān)注的5個(gè)NFT項(xiàng)目

2021年，我們見證了一個(gè)新的創(chuàng)造者經(jīng)濟(jì)的誕生。它是在區(qū)塊鏈上誕生的。自從NFT成為流行文化的中心舞臺(tái)以來(lái)，有些藝術(shù)家們已經(jīng)成為了NFT的超級(jí)明星，在幾個(gè)月的時(shí)間

国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美日韩国产一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

首頁(yè)

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

大模型“自動(dòng)修 bug”能力將提升，豆包團(tuán)隊(duì)開源首個(gè)多語(yǔ)言代碼修復(fù)基準(zhǔn) Multi-SWE-bench

元宇宙的文旅賽道，還能如何發(fā)力？

元宇宙帶來(lái)沉浸式智能登錄？你學(xué)會(huì)了嗎？

Meta公布AI概念“Builder Bot”；銀保監(jiān)發(fā)布元宇宙相關(guān)風(fēng)險(xiǎn)提示

NFT盜竊案：為什么NFT市場(chǎng)被盜竊和黑客所困擾？

元宇宙畫廊體驗(yàn)報(bào)告：有點(diǎn)頭疼。

在元宇宙開會(huì)是什么樣一種體驗(yàn)

獨(dú)立故事片“Calladita”將使用 NFT 籌集資金

知識(shí)產(chǎn)權(quán)可能在元宇宙中“消失”？

3月份值得關(guān)注的5個(gè)NFT項(xiàng)目

最新推薦

B端難做：留給魔琺科技的時(shí)間不多了

“平均時(shí)代”：ChatGPT模仿秀的隱喻

Niantic與索尼在音頻AR領(lǐng)域達(dá)成合作；?蘋果為Apple Park申請(qǐng)形象化商標(biāo)

費(fèi)城藝術(shù)家使用區(qū)塊鏈，在數(shù)字藝術(shù)中狠狠撈一筆

暴漲100倍的NFT worlds 會(huì)是未來(lái)元宇宙的雛形嗎？

百度虛擬人——AI手語(yǔ)主播首次亮相冬奧會(huì)！

猜你喜歡

熱門推薦

相關(guān)資訊