在最新一期的SuperCLUE中文大模型通用基準(zhǔn)測評中,華為憑借其7180億參數(shù)的MoE架構(gòu)大模型openPangu-Ultra-MoE-718B躋身前三,與DeepSeek-V3.1、Qwen3-235B等開源模型同臺競技。這一成績的背后,是團隊對模型訓(xùn)練邏輯的深度重構(gòu)——通過數(shù)據(jù)質(zhì)量優(yōu)先、三階段預(yù)訓(xùn)練、批判性思維內(nèi)化等創(chuàng)新策略,突破了傳統(tǒng)“堆數(shù)據(jù)”的路徑依賴。
數(shù)據(jù)構(gòu)建環(huán)節(jié),團隊摒棄了“以量取勝”的常規(guī)做法,轉(zhuǎn)而建立“質(zhì)量評估-科學(xué)篩選-精準(zhǔn)增強”的全流程體系。在指令數(shù)據(jù)清洗階段,采用規(guī)則、模型、人工三重審核機制,確保低質(zhì)量樣本被徹底過濾;在任務(wù)設(shè)計上,通過領(lǐng)域與任務(wù)類型的雙重維度覆蓋,結(jié)合去重算法避免冗余;針對模型易在簡單任務(wù)上過擬合的問題,團隊量化推理步驟、概念抽象度等指標(biāo),重點強化中高難度任務(wù)的訓(xùn)練比例。這種對數(shù)據(jù)質(zhì)量的嚴(yán)苛把控,為模型在復(fù)雜場景下的推理能力奠定了基礎(chǔ)。
預(yù)訓(xùn)練階段,團隊將整個過程拆解為通用、推理、退火三個遞進階段。通用階段通過海量文本與代碼數(shù)據(jù),構(gòu)建模型的世界知識基礎(chǔ);推理階段大幅增加泛數(shù)學(xué)、STEM及代碼數(shù)據(jù)的比重,并引入高難度多步驟推理題庫,配合詳細思維鏈(CoT)引導(dǎo)模型學(xué)習(xí)邏輯路徑;退火階段則通過階梯式擴展上下文長度至128K,同時增加指令類數(shù)據(jù)與Agent工具使用數(shù)據(jù),使模型逐步掌握外部工具調(diào)用能力。這種分階段訓(xùn)練策略,有效平衡了模型的基礎(chǔ)認(rèn)知與專項能力。
針對大型語言模型普遍存在的幻覺問題,團隊提出“批判內(nèi)化”機制。與傳統(tǒng)批判微調(diào)(CFT)依賴固定人類反饋數(shù)據(jù)不同,該機制在模型訓(xùn)練完成后,通過拒絕采樣引入自我批判信號,迫使模型在生成答案時主動審視推理過程。例如,在數(shù)學(xué)推理任務(wù)中,模型需檢查邏輯鏈條是否完整、計算步驟是否準(zhǔn)確;在代碼生成任務(wù)中,則需驗證語法正確性與功能實現(xiàn)度。實驗數(shù)據(jù)顯示,這一機制使模型的指令遵從性與輸出可靠性顯著提升。
在工具使用能力方面,團隊開發(fā)的ToolACE框架通過四項關(guān)鍵技術(shù)實現(xiàn)突破:領(lǐng)域工具組合技術(shù)將關(guān)聯(lián)工具(如日歷查詢與航班預(yù)訂)綁定,提供工具依賴圖;交互式目標(biāo)軌跡生成采用“計劃-執(zhí)行”分離策略,先由AI規(guī)劃工具調(diào)用序列,再通過模擬環(huán)境執(zhí)行;多智能體對話生成引入隨機打斷、反問澄清等復(fù)雜交互;多維校驗與錯例迭代則對生成數(shù)據(jù)進行內(nèi)容滿足度、狀態(tài)變化正確性等多維度評估,低分?jǐn)?shù)據(jù)將反哺生成策略優(yōu)化。經(jīng)此訓(xùn)練的模型,在復(fù)雜多輪交互中展現(xiàn)出精準(zhǔn)的工具調(diào)用能力。
后訓(xùn)練階段,團隊采用“漸進動態(tài)微調(diào)-強化學(xué)習(xí)-模型融合”三步策略。漸進動態(tài)微調(diào)(PDFT)通過動態(tài)調(diào)整訓(xùn)練權(quán)重,避免模型對特定數(shù)據(jù)過擬合;強化學(xué)習(xí)環(huán)節(jié)選用GSPO算法,相比傳統(tǒng)GRPO算法在訓(xùn)練穩(wěn)定性上提升30%;模型融合階段則通過黑盒優(yōu)化算法,自動搜索不同版本模型的最佳組合權(quán)重,生成綜合性能更強的最終模型。這一系列優(yōu)化,使openPangu-718B在數(shù)學(xué)推理、代碼生成、幻覺控制等六個維度的評估中均表現(xiàn)優(yōu)異。
從數(shù)據(jù)篩選到訓(xùn)練策略,從幻覺控制到工具學(xué)習(xí),openPangu-718B的突破印證了一個核心邏輯:大模型的競爭力不在于參數(shù)規(guī)模或數(shù)據(jù)體量,而在于對技術(shù)細節(jié)的極致打磨。當(dāng)行業(yè)仍在爭論“規(guī)模定律”是否適用時,華為用實踐給出了另一種答案——通過系統(tǒng)性技術(shù)創(chuàng)新,同樣能在激烈競爭中開辟新路徑。
更多>同類資訊華為盤古718B模型脫穎而出:數(shù)據(jù)質(zhì)量與技術(shù)創(chuàng)新雙輪驅(qū)動09-29象嶼集團攜手釘釘,借AI之力開啟數(shù)智化新篇,3萬員工共赴轉(zhuǎn)型新程象嶼集團此次與釘釘合作,不僅是AI技術(shù)平臺的引入,更是雙方對未來發(fā)展方向的高度共識。 值得一提的是,象嶼集團此次全面引入釘釘One、DingTalk A1、AI聽記、AI搜問、AI表格等釘釘AI新品,聚焦用…09-29云天勵飛加入OISA生態(tài),以“算力積木”助力國產(chǎn)AI算力突破MoE大模型瓶頸憑借在 AI 推理芯片與算力架構(gòu)的長期積累,云天勵飛成為 OISA 生態(tài)的重要一員。 未來,云天勵飛將繼續(xù)秉持“AI時代的加速器”愿景,持續(xù)迭代芯片技術(shù)與架構(gòu)創(chuàng)新,攜手 OISA 生態(tài)伙伴,共同推動智能算…09-29四川資源集團攜手華為 共繪智慧礦山藍圖 探索數(shù)智化賦能新路徑封面新聞記者 付文超9月29日,記者獲悉,四川省自然資源投資集團有限責(zé)任公司(以下簡稱“四川資源集團”)與華為技術(shù)有限公司(以下簡稱“華為”)簽署框架合作協(xié)議。 根據(jù)協(xié)議,雙方將在智慧礦山規(guī)劃和建設(shè)、人工智…09-29Flash Attention作者Tri Dao:英偉達GPU主導(dǎo)地位或三年內(nèi)瓦解,AI硬件將迎多元生態(tài)他們設(shè)計了非常好的芯片,也有非常好的軟件支持,這讓我能夠做很多有意思的事情,而這正是我追求的:能不能做出有意思的東西。舉例我做的Mamba,思路是讓模型把歷史壓縮成更小的狀態(tài)向量,而不是保存完整的KV c…09-29?長智具身智能科技公司在海南成立 智元機器人長飛光纖等攜手布局?09-29AMD與NVIDIA下一代AI GPU競速:設(shè)計迭代升級,技術(shù)差距或縮小09-29中國算力生態(tài)競速:華為開源破局,產(chǎn)業(yè)鏈協(xié)同共筑全球競爭力09-29奧特曼攜OpenAI大舉布局AI投資,與英偉達等合作能否成就AI未來?09-29第22屆東博會AI元素爆棚:“黑科技”互動不斷,共繪中國—東盟新藍圖09-29科技浪潮下的人文溫度:莫言憶小學(xué)課堂“粉筆頭”里的鮮活記憶09-29俄羅斯數(shù)字服務(wù)員亮相高端餐廳:AI精準(zhǔn)推薦,重塑餐飲服務(wù)新體驗09-29高德云棲大會亮劍:空間智能賦能千行百業(yè),構(gòu)建物理世界交互新生態(tài)09-29京東JDD大會發(fā)布AI全景圖,推三大新品四大應(yīng)用,繪萬億AI生態(tài)藍圖該體系依托Joy AI大模型打造豐富的系統(tǒng)能力和多元化智能體,通過AI技術(shù)構(gòu)建電商購物、供應(yīng)鏈管理等智能應(yīng)用場景,系統(tǒng)展現(xiàn)了AI技術(shù)在京東電商業(yè)務(wù)中的應(yīng)用,描摹出京東零售面向未來的AI電商藍圖。同時,承載新一…09-29“人機共創(chuàng)”三重真相:AI為翼 人為舵 共拓創(chuàng)作新邊界09-29點擊查看更多 +全站最新
科大訊飛P30學(xué)習(xí)機:寶媽育兒好幫手,護眼又高效,孩子學(xué)習(xí)更輕松
王心凌傾情代言!馬自達EZ-60攜雙動力上市,11.99萬起開啟合資新體驗
深藍汽車X華為乾崑長沙試駕落幕:智能增程齊發(fā)力,親子互動共團圓
MAZDA EZ-60售價11.99萬元起,王心凌代言,智能配置拉滿開啟電動新篇
小米定制服務(wù):以頂級工藝邂逅個性色彩,三年百色計劃解鎖專屬汽車美學(xué)
小米新品發(fā)布會全覽:一圖解鎖系列新品亮點與指南熱門內(nèi)容
第22屆東博會AI元素亮眼:數(shù)字智能體引路 機器人炫技展風(fēng)采
AI云競爭下半場:華為以超節(jié)點、企業(yè)Agent等破局,誰能領(lǐng)跑產(chǎn)業(yè)?
2025網(wǎng)安周:每日互動劉宇談AI時代,知識安全成關(guān)鍵,共筑數(shù)字新未來
中國大模型DeepSeek首登Nature封面,R1訓(xùn)練成本僅約208萬引關(guān)注
華為全聯(lián)接大會2025啟幕,發(fā)布全球最強算力超節(jié)點與集群
有鹿機器人+連合直租:以智能租賃模式,開啟高端場景清潔新未來
本文鏈接:http://www.rrqrq.com/showinfo-45-28458-0.html華為盤古718B模型如何突圍?從數(shù)據(jù)質(zhì)量到Agent能力的系統(tǒng)化創(chuàng)新
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
下一篇: 華為盤古718B模型脫穎而出:數(shù)據(jù)質(zhì)量與技術(shù)創(chuàng)新雙輪驅(qū)動