階躍星辰公司近期震撼發布了其最新的開源語音大模型Step-Audio2mini,這一創新成果在國際基準測試中大放異彩,斬獲了最先進技術(SOTA)的殊榮。Step-Audio2mini不僅在語音理解和音頻生成領域展現出強大的實力,更首次將音頻推理與生成整合至同一模型中,為語音識別、跨語言交流及情感分析等多元化應用場景提供了卓越的解決方案。
該模型的一大亮點在于其出眾的多模態音頻理解能力。在備受矚目的多模態音頻理解測試集(MMAU)上,Step-Audio2mini以73.2分的優異成績,穩居開源語音模型排行榜首位。在口語對話能力的權威測試URO Bench中,無論是在基礎賽道還是專業賽道,Step-Audio2mini均取得了開源模型中的最高分數,彰顯了其對話理解與表達方面的卓越才能。
在中英互譯任務上,Step-Audio2mini同樣表現出色。在CoVoST2和CVSS評測集上,該模型分別斬獲了39.3和29.1的高分,顯著超越了GPT-4o Audio等競爭對手,以及其他開源語音模型。在語音識別領域,Step-Audio2mini同樣表現非凡,在開源中文測試集上的字錯誤率僅為3.19%,在開源英語測試集上的詞錯誤率也僅為3.50%,相較于其他開源模型,領先幅度超過15%。
Step-Audio2mini的成功得益于其獨特的架構設計。該模型摒棄了傳統的自動語音識別(ASR)、大語言模型(LLM)和文本轉語音(TTS)三級結構,實現了從原始音頻輸入到語音響應輸出的無縫轉換,極大地簡化了模型架構,降低了處理延遲。同時,模型還融入了鏈式思維推理(CoT)與強化學習的聯合優化技術,使其能夠更精準地捕捉情緒、語調等副語言信息,并作出自然流暢的回應。
尤為Step-Audio2mini還具備音頻知識增強功能,能夠借助外部工具進行聯網搜索,有效解決了傳統模型中的幻覺問題。這一創新特性不僅提升了模型的實用性和可靠性,還進一步拓寬了其在各類應用場景中的潛力。
目前,Step-Audio2mini已在GitHub、Hugging Face等知名平臺上架,誠邀廣大開發者前來試用并貢獻代碼,共同推動語音技術的創新發展。
舉報 0收藏 0打賞 0評論 0分享 0 更多>同類資訊中國AI大模型調用量激增,開源技術成企業競爭新賽道09-01抖音強化AI內容管理,推出標識與元數據讀寫新功能09-01OpenAI計劃在印度建大型數據中心,加速亞洲AI基礎設施發展09-01超聚變數博會重磅登場:以AI+數據全棧方案應對智能體時代挑戰09-01阿里巴巴港股大漲近18%,第一財季業績超預期,阿里云營收增速創新高09-01臺積電2nm工藝量產在即,英偉達缺席首批,預計2027年加入09-01
華為智能手表登頂全球,蘋果需直面挑戰求變革以46毫米款的Apple Watch Series 10為例,蘋果官方宣稱其續航可達18小時;而Apple Watch Ultra 2在正常使用情況下,續航能翻倍至36小時。和其他智能手表廠商一樣,蘋果通過這…09-01
阿里云否認大規模采購寒武紀思元370芯片傳聞資料顯示,思元370芯片基于7nm制程工藝,是寒武紀首款采用chiplet(芯粒)技術的AI芯片,集成了390億個晶體管,最大算力高達256TOPS(INT8),是寒武紀第二代產品思元270算力的2倍。 …09-01馬斯克旗下xAI代碼庫遭竊,前核心員工跳槽OpenAI引訴訟09-01MedResearcher-R1:醫療AI推理新突破,知識圖譜賦能智能軌跡合成09-01階躍星辰推出Step-Audio2mini,端到端語音大模型刷新多項國際基準測試成績09-01科大訊飛灣區總部及產業加速中心深圳啟動,賦能區域數字化轉型每經AI快訊,據深圳發布,近日,科大訊飛灣區總部及深圳產業加速中心在深圳龍華正式啟動,邁出在粵港澳大灣區深化布局的關鍵一步。產業加速中心依托科大訊飛核心技術能力和國家新一代人工智能開放創新平臺集聚的開發者資源…09-01
阿里:AI與消費雙輪驅動,財報超預期展現強勁增長力過去四個季度,我們已經在 AI 基礎設施以及 AI 產品研發上累計投入超過 1000 億元”,吳泳銘說,阿里對 AI的投入已開始顯現成果,無論是阿里云在客戶的 AI 需求下恢復高速增長,還是廣泛的 to C…09-01
2025數智化轉型論壇:AI大模型與AI Agent引領破界反卷新篇章正是在這樣的背景之下,由數智猿×數據猿聯合主辦,中關村科學城公司協辦,新華社中國經濟信息社×北京軟件和信息服務業協會×中國互聯網協會數字化轉型與發展工作委員會×上海大數據聯盟作為支持單位的的“2025第五屆…09-01科大訊飛灣區總部啟航龍華,深圳產業加速中心賦能創新生態產業加速中心依托科大訊飛核心技術能力和國家新一代人工智能開放創新平臺集聚的開發者資源,打造“線上+線下”相融合的創新創業服務加速平臺,為開發者、創業企業和區域產業數字化轉型提供線下賦能,通過創業孵化、產業聚…09-01點擊查看更多 +全站最新
銳勝汽車獨立亮相,北京汽車制造廠專攻12-25萬MPV市場
魏牌高山7成都車展預售在即,品牌以用戶為中心持續攀登新高峰
奔馳計劃2026年停產EQE系列,電動C級EQ與GLC EQ將接力登場
李想定目標:理想汽車年底純電車型月銷望達1.8萬至2萬輛
理想汽車8月交付量近2.9萬輛,i6九月上市并即交付市場
奔馳V8發動機在研,卻傳將購寶馬四缸機:戰略調整還是權宜之計?熱門內容
華為智能手表登頂全球,蘋果需直面挑戰求變革
阿里云否認大規模采購寒武紀思元370芯片傳聞
阿里:AI與消費雙輪驅動,財報超預期展現強勁增長力
2025數智化轉型論壇:AI大模型與AI Agent引領破界反卷新篇章
科大訊飛再傳捷報:中標安徽稅務智能咨詢子系統運行維護項目
科大訊飛灣區總部深圳龍華啟航,生態企業集群入駐共促AI產業發展
本文鏈接:http://www.rrqrq.com/showinfo-45-27213-0.html階躍星辰發布Step-Audio2mini:開源語音大模型,理解精準,表達自然
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com