国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當前位置:首頁 > 元宇宙 > AI

受 DeepSeek-R1 啟發,小米大模型團隊登頂音頻推理 MMAU 榜

來源: 責編: 時間:2025-03-19 09:41:26 145觀看
導讀 3 月 17 日消息,@小米技術 官微今日發文稱,小米大模型團隊在音頻推理領域取得突破性進展。受 DeepSeek-R1 啟發,團隊率先將強化學習算法應用于多模態音頻理解任務,僅用一周時間便以 64.5% 的 SOTA 準確率登頂國際

3 月 17 日消息,@小米技術 官微今日發文稱,小米大模型團隊在音頻推理領域取得突破性進展。受 DeepSeek-R1 啟發,團隊率先將強化學習算法應用于多模態音頻理解任務,僅用一周時間便以 64.5% 的 SOTA 準確率登頂國際權威的 MMAU 音頻理解評測榜首,現同步開源。ull28資訊網——每日最新資訊28at.com

ull28資訊網——每日最新資訊28at.com

附官方全文如下:ull28資訊網——每日最新資訊28at.com

強化學習展現“反直覺”優勢 —— 小米大模型團隊登頂音頻推理 MMAU 榜

面對一段汽車行駛中的座艙錄音,AI 能否判斷出汽車是否存在潛在的故障?在交響樂演出現場,AI 能否推測出作曲家創造這首音樂時的心情?在早高峰地鐵站混亂的腳步聲潮中,AI 能否預判閘機口可能發生的沖撞風險?在大模型時代,人們已經不滿足于機器僅僅識別說話的內容、聲音的種類,更期望機器具備復雜推理的能力。ull28資訊網——每日最新資訊28at.com

MMAU(Massive Multi-Task Audio Understanding and Reasoning)評測集(https://arxiv.org/ abs / 2410.19168)是這種音頻推理能力的量化標尺,它通過一萬條涵蓋語音、環境聲和音樂的音頻樣本,結合人類專家標注的問答對,測試模型在 27 種技能,如跨場景推理、專業知識等應用上的表現,期望模型達到接近人類專家的邏輯分析水平。ull28資訊網——每日最新資訊28at.com

作為基準上限,人類專家在 MMAU 上的準確率為 82.23%。這是一個很難的評測集,目前 MMAU 官網榜單上表現最好的模型是來自 OpenAI 的 GPT-4o,準確率為 57.3%。緊隨其后的是來自 Google DeepMind 的 Gemini 2.0 Flash,準確率為 55.6%。ull28資訊網——每日最新資訊28at.com

ull28資訊網——每日最新資訊28at.com

MMAU 任務示例圖片來自 MMAU 論文

來自阿里的 Qwen2-Audio-7B 模型在此評測集上的準確率為 49.2%。由于它的開源特性,我們嘗試使用一個較小的數據集,清華大學發布的 AVQA 數據集(https://mn.cs.tsinghua.edu.cn/ avqa/),對此模型做微調。AVQA 數據集僅包含 3.8 萬條訓練樣本,通過全量有監督微調(SFT),模型在 MMAU 上的準確率提升到了 51.8%。這并不是一個特別顯著的提升。ull28資訊網——每日最新資訊28at.com

DeepSeek-R1 的發布為我們在該項任務上的研究帶來了啟發。DeepSeek-R1 的 Group Relative Policy Optimization (GRPO) 方法,讓模型僅通過 "試錯-獎勵" 機制就能使自主進化,涌現出類似人類的反思、多步驗證等推理能力。在同一時間,卡內基梅隆大學發布的論文預印本“All Roads Lead to Likelihood: The Value of Reinforcement Learning in Fine-Tuning (https://arxiv.org/ abs / 2503.01067) ”,通過精巧的實驗得出了一個有趣的論斷:當任務存在明顯的生成-驗證差距(Generation-Verification Gap),即任務生成結果的難度遠大于驗證結果正確性的難度時,強化學習比起有監督微調具有獨特優勢,而 AQA 任務恰好是完美的生成-驗證差距顯著的任務。ull28資訊網——每日最新資訊28at.com

打個比方來說,離線微調方法,如 SFT,有點像背題庫,你只能根據已有的題目和答案訓練,但遇到新題可能不會做;而強化學習方法,如 GRPO,像老師在要求你多想幾個答案,然后老師告訴你哪一個答案好,讓你主動思考,激發出自身的能力,而不是被“填鴨式”教學。當然,如果訓練量足夠,比如有學生愿意花很多年的時間來死記硬背題庫,也許最終也能達到不錯的效果,但效率太低,浪費太多時間。而主動思考,更容易快速地達到舉一反三的效果。強化學習的實時反饋可能會幫助模型更快鎖定高質量答案的分布區域,而離線方法需要遍歷整個可能性空間,效率要低得多。ull28資訊網——每日最新資訊28at.com

基于上述洞察,我們嘗試將 DeepSeek-R1 的 GRPO 算法遷移到 Qwen2-Audio-7B 模型上。令人驚喜的是,在僅使用 AVQA 的 3.8 萬條訓練樣本的情況下,強化學習微調后的模型在 MMAU 評測集上實現了 64.5% 的準確率,這一成績比目前榜單上第一名的商業閉源模型 GPT-4o 有近 10 個百分點的優勢。ull28資訊網——每日最新資訊28at.com

有趣的是,當我們在訓練中強制要求模型輸出 <thinking></thinking> 推理過程時(類似傳統思維鏈方法),準確率反而下降至 61.1%。這說明顯式的思維鏈結果輸出可能并不利于模型的訓練。ull28資訊網——每日最新資訊28at.com

我們的實驗揭示了幾個和傳統認知不同的結論:ull28資訊網——每日最新資訊28at.com

關于微調方法:強化學習在 3.8 萬條數據集上的表現顯著超過監督學習在 57 萬條數據集上的結果ull28資訊網——每日最新資訊28at.com

關于參數規模:相比千億級模型,7B 參數的模型通過強化學習也可展現強推理能力ull28資訊網——每日最新資訊28at.com

關于隱式推理:顯式思維鏈輸出反而成為性能瓶頸ull28資訊網——每日最新資訊28at.com

盡管當前準確率已突破 64%,但距離人類專家 82% 的水平仍有差距。在我們當前的實驗中,強化學習策略還是比較粗糙,訓練過程對思維鏈的引導并不充分,我們會在后續做進一步探索。ull28資訊網——每日最新資訊28at.com

此次實驗驗證了強化學習在音頻推理領域的獨特價值,也為后續研究打開了一扇新的大門。當機器不僅能 "聽見" 聲音,還能 "聽懂" 聲音背后的因果邏輯時,真正的智能聽覺時代將會來臨。ull28資訊網——每日最新資訊28at.com

我們把訓練代碼、模型參數開源,并提供了技術報告,供學術界產業界參考交流。ull28資訊網——每日最新資訊28at.com

訓練代碼:https://github.com/xiaomi-research/r1-aqaull28資訊網——每日最新資訊28at.com

模型參數:https://huggingface.co/mispeech/r1-aqaull28資訊網——每日最新資訊28at.com

技術報告:https://arxiv.org/abs/2503.11197ull28資訊網——每日最新資訊28at.com

交互 Demo:http://120.48.108.147:7860/ull28資訊網——每日最新資訊28at.com

本文鏈接:http://www.rrqrq.com/showinfo-45-11593-0.html受 DeepSeek-R1 啟發,小米大模型團隊登頂音頻推理 MMAU 榜

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:[email protected]

上一篇: AI 助力,新研究只用 5 滴血就能測出你的真實生理年齡

下一篇: “AI 作弊”助程序員線上面試蒙混過關,谷歌等大廠考慮恢復面對面形式

標簽:
  • 熱門焦點
  • AI大模型“戰火”燒到了教育領域

    作者:劉曠自2023年開年以來,AI大模型這股風是越吹越猛烈了。隨著ChatGPT的出圈爆火,再度掀起了一波AI熱浪,無論是在國內還是國外都有不少企業宣布入局或者跟進AI大模型領域。與
  • VR/AR迷失元宇宙“硝煙”

    不溫不火的VR/AR可穿戴設備因元宇宙崛起火了一陣,又隨著元宇宙回歸平靜。1月份,微軟在 Surface 設備、HoloLens 混合現實硬件和 Xbox 等部門裁員,其中負責混合現實硬件(MR)的Holo
  • 汽車元宇宙,是概念還是未來?

    作者|何文 元宇宙是未來趨勢已經無需驗證。 從概念上來看,元宇宙是兩種存在多年的概念的融合:虛擬現實和數字第二人生。這也就意味著,元宇宙所代表的是一種新的數
  • 2022開年最熱投資賽道竟是虛擬人,背后隱藏了什么商業價值?

    在剛剛結束不久的2021年江蘇衛視跨年演唱會上,虛擬鄧麗君與歌手周深同臺聯唱,實現了跨時代合作,而這還不只是“鄧麗君”,嗶哩嗶哩、東方衛視等多家跨年晚會都出現
  • “啫喱”超越微信登頂:首款“元宇宙社交App”會曇花一現嗎?

    作者| 赤木瓶子如何終結“曇花一現”的命運,是潮流社交產品的長期命題,如今,在元宇宙浪潮的洗禮下,這一命題正在迎來新的可能性。近段時間,一款名為“啫喱”的社交A
  • 2030年的元宇宙產業將會如何發展?

    對互聯網巨頭傳統業務的反壟斷政策倒逼互聯網企業顛覆創新,尋找新的增長點,移動互聯網流量空間見頂之際,元宇宙時代紅利已然開啟。序章:元宇宙應用場景大猜想元宇
  • NFT藝術家Hayley Rincon 專訪:我的迷幻數字藝術之路

    Hayley Rincon是一位令人印象深刻才華橫溢的創作者,她的作品呈現出迷幻的氣息。今天就來聊聊她的藝術作品,和她自己的數字藝術之路。Hayley是加利福尼亞灣區的有
  • Interface正大光明的“跑路”,社區成員贊格局大

    今日凌晨,一個廣泛受社區期待的潛力藍籌項目Interfaces突然發文宣布項目停止運營,后續也不會有鑄造NFT系列的活動。這對社區來說就是一重磅炸彈,大多數人完全不明
  • 元宇宙平臺會是上世紀末的互聯網嗎?

    “元宇宙”火了好幾個月,互聯網大廠忙于布局,資本市場熱烈追捧。然而很多人還是看不明白,更多的人覺得這是一場泡沫,一場騙局。一開始接觸這個怪里怪氣的名詞,感覺
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
欧美日韩你懂的| 欧美91视频| 欧美亚洲禁片免费| 亚洲成人av资源| 欧美三级午夜理伦三级中视频| 亚洲 欧美综合在线网络| 日韩精品久久理论片| 久久综合久久久久88| 国产精品亚洲一区二区三区妖精| 欧美日韩日日摸| 99久久精品国产毛片| 《视频一区视频二区| 国产欧美二区| 麻豆成人91精品二区三区| 欧美精品一二三| 黄色欧美日韩| 日韩av网站在线观看| 狼狼综合久久久久综合网| 精品一区二区在线视频| 久久久久久久电影| 国产一区二区你懂的| 精品在线亚洲视频| 一区二区三区精品| 91精品国产欧美一区二区| 亚洲福利免费| 国产成人免费视频一区| 国产精品久久久久久久久久免费看| 99精品视频一区二区| 亚洲高清中文字幕| 亚洲国产精品传媒在线观看| 日本国产一区二区| 972aa.com艺术欧美| 午夜精品久久久久影视| 久久综合久久综合亚洲| 亚洲毛片网站| 亚洲成人在线视频网站| 欧美 日韩 国产在线| 久久狠狠亚洲综合| 久久精品一区二区三区不卡牛牛| 国产精品五区| 欧美三区不卡| 久久成人免费电影| 丝袜美腿成人在线| 亚洲一区二区高清| 久久久99精品免费观看| 欧美v日韩v国产v| 色八戒一区二区三区| 狂野欧美性猛交xxxx巴西| 你懂的国产精品| 激情另类小说区图片区视频区| 视频一区二区不卡| 亚洲色图色小说| 亚洲国产欧美在线| 亚洲日本一区二区| 亚洲国产综合视频在线观看| 国产xxx精品视频大全| 麻豆精品精品国产自在97香蕉| 亚洲成在人线在线播放| 日韩av在线播放中文字幕| 亚洲成av人片在www色猫咪| 五月综合激情婷婷六月色窝| 亚洲人快播电影网| 亚洲福利一二三区| 亚洲精品成人精品456| 久久久欧美精品sm网站| 激情婷婷欧美| 日韩视频三区| 欧美在线制服丝袜| 久久久久综合网| 一区二区三区四区视频精品免费 | 成人性视频免费网站| 欧美在线3区| 在线一区二区视频| 久久久久久久久久久久久久久99| 精品三级在线观看| 亚洲国产另类精品专区| 风流少妇一区二区| 欧美精品97| 欧美在线免费播放| 久久久精品国产99久久精品芒果 | 欧美日韩国产精选| 国产精品污www在线观看| 丝袜诱惑制服诱惑色一区在线观看| 国产毛片精品一区| 99久久夜色精品国产网站| 最新成人av网站| 日韩欧美国产1| 亚洲大片免费看| 国产一区二区三区高清播放| 99re这里都是精品| 美女视频一区免费观看| 久久九九久久九九| 美女视频黄久久| 午夜天堂精品久久久久| 91福利在线观看| 久久女同精品一区二区| 午夜伦理一区二区| 91在线一区二区| 欧美三级日韩三级| 日本不卡在线视频| 亚洲福利一区| 国产精品国产三级国产aⅴ中文| 免费观看久久久4p| 久久久久久精| 免费高清在线一区| 色欧美片视频在线观看| 亚洲一区在线观看免费| 狠狠噜噜久久| 亚洲一区二区三区四区的| 国产精品日韩一区二区 | 国产精品一区2区| 9191久久久久久久久久久| 精品一区二区久久久| 欧美美女bb生活片| 国产资源在线一区| 久久精品男女| 全部av―极品视觉盛宴亚洲| 欧美老肥妇做.爰bbww| 国产成人亚洲精品青草天美| 久久先锋影音av| 99精品国产在热久久| 亚洲18色成人| 欧美一级日韩一级| 国模吧视频一区| 性感美女久久精品| 日韩免费成人网| 欧美精品一卡| 综合欧美一区二区三区| 欧洲在线/亚洲| 伊人成人在线| 日韩不卡一区二区| 国产亚洲精品资源在线26u| 99热这里只有成人精品国产| 蜜臀av性久久久久蜜臀aⅴ| 国产日韩欧美电影| 欧美一区二视频| 亚洲日本成人| 欧美日韩一视频区二区| 奇米888四色在线精品| 久久久精品免费网站| 免费在线欧美黄色| 亚洲特色特黄| 91在线播放网址| 国产一区二区毛片| 亚洲一区二区免费视频| 国产精品第一页第二页第三页| 一本色道久久综合亚洲精品婷婷 | 久久综合久久综合亚洲| 亚洲国产精品www| 成人免费视频caoporn| 亚洲欧美综合网| 久久免费精品国产久精品久久久久| 免费在线成人av| 日韩亚洲国产欧美| 97久久超碰国产精品电影| 久久成人久久爱| 美女诱惑一区二区| 婷婷综合五月天| 亚洲色图制服诱惑| 国产精品天天看| 久久精品官网| 亚洲看片网站| 国产精品成人一区二区网站软件| 一区二区三区在线免费视频| 精品国产在天天线2019| 欧美日韩成人综合| 欧美日韩午夜在线| 成人ar影院免费观看视频| 色婷婷激情久久| 成人久久视频在线观看| 国模娜娜一区二区三区| 国产精品99久久久久久久vr| 国产成人精品网址| 国产精品99精品久久免费| 国产麻豆精品theporn| 波多野结衣欧美| 国产综合自拍| 精品视频一区二区不卡| 91激情五月电影| 精品国产一区二区三区不卡| xnxx国产精品| 成人欧美一区二区三区| 乱中年女人伦av一区二区| 国产精品亚洲人在线观看| 欧美不卡在线| 久久成人在线| 日韩欧美中文字幕一区| 久久久不卡网国产精品一区| 亚洲精品综合在线| 久久成人羞羞网站| 亚洲亚洲精品三区日韩精品在线视频| 亚洲午夜精品福利| 噜噜爱69成人精品| 欧美电视剧在线观看完整版| 亚洲女人****多毛耸耸8| 蜜乳av一区二区| 欧美日韩一区二区三区免费看| 正在播放亚洲一区| 亚洲人成精品久久久久| 国产激情偷乱视频一区二区三区|