人工智能領域迎來重要突破,通義DeepResearch正式開源發布,標志著AI研究能力從“對話交互”向“深度探索”的跨越式發展。該模型在Humanity's Last Exam、BrowseComp、GAIA等國際權威深度研究基準測試中均取得最優成績,綜合性能與海外旗艦模型持平甚至超越,同時以完全開源的方式提供模型、框架及解決方案。IqW28資訊網——每日最新資訊28at.com
針對海外閉源模型使用成本高、調用受限等問題,研發團隊通過創新技術路徑實現突破。30B參數規模的tongyi DeepResearch在保持輕量化的同時,通過多階段數據策略和強化學習優化,在復雜推理任務中展現出顯著優勢。其核心技術覆蓋數據合成、增量預訓練、有監督微調及強化學習全流程,形成端到端的智能體訓練范式。IqW28資訊網——每日最新資訊28at.com
數據構建方面,團隊開發出全自動化合成方案。通過知識圖譜隨機游走、表格數據融合等技術,從真實網站提取結構化信息,并設計“原子操作”系統提升問題復雜度。特別在決策動作合成中,將多步驟軌跡重構為決策過程,有效增強模型規劃能力。該方案生成的“博士級”研究問題,可模擬多學科交叉推理場景,推動模型能力逼近人類專家水平。IqW28資訊網——每日最新資訊28at.com
模型架構創新包含雙重推理模式:標準ReAct模式支持128K長上下文交互,通過“思考-行動-觀察”循環處理常規任務;深度模式(Heavy Mode)則采用IterResearch范式,將復雜任務分解為多個研究輪次。每輪僅保留關鍵信息構建精簡工作空間,通過“綜合與重構”迭代保持認知焦點,避免傳統方法中的信息過載問題。團隊還提出Research-Synthesis框架,允許多智能體并行探索后整合結論,顯著提升答案準確性。IqW28資訊網——每日最新資訊28at.com
訓練體系實現全鏈路革新,從Agentic持續預訓練(CPT)到拒絕微調(RFT)再到強化學習(RL),形成閉環優化系統。在RL階段,團隊基于GRPO算法進行定制優化,采用on-policy訓練范式確保學習信號與模型能力精準匹配。通過token級策略梯度損失、留一法優勢估計等技術,有效降低訓練方差。針對負樣本干擾問題,開發選擇性過濾機制,結合大批量訓練維持監督信號穩定性。IqW28資訊網——每日最新資訊28at.com
基礎設施層面構建三大支撐系統:仿真訓練環境利用離線維基百科和自定義工具套件,降低對實時Web API的依賴;穩定工具沙盒通過緩存、重試和飽和響應機制,確保工具調用的可靠性;自動數據管理系統實現訓練動態指導下的實時優化,形成數據生成與模型訓練的正向循環。異步強化學習框架支持多智能體并行交互,顯著提升訓練效率。IqW28資訊網——每日最新資訊28at.com
技術落地已產生實際價值。與高德合作的出行智能體“高德小德”,在地圖導航和本地生活場景中實現復雜查詢的垂類應用,成為高德V16版本的核心功能。法律領域推出的“通義法睿”智能體,集成案例檢索、合同審查、文書起草等功能,通過迭代規劃技術實現多步推理,在答案質量、案例引用、法條匹配等維度達到行業領先水平。IqW28資訊網——每日最新資訊28at.com
研發團隊同步發布六篇技術報告,詳細闡述數據合成策略、強化學習優化、多智能體協作等關鍵技術。開源社區已上線30B參數規模的tongyi DeepResearch模型,配套提供框架代碼和訓練方案。此前半年間,團隊保持每月發布技術報告的節奏,持續推動深度研究智能體領域的技術演進。IqW28資訊網——每日最新資訊28at.com
更多>同類資訊
宇樹科技杜鑫峰:機器人從文娛到工業,在電網儲能等場景展身手09-18

DeepSeek發布嚴正聲明:警惕不法分子冒用名義開展“算力租賃”“融資”詐騙09-18

DeepSeek登《Nature》封面:梁文鋒團隊以低成本創新,開啟AI推理革命新篇09-18

華為徐直軍:Atlas 950超節點算力卓越,多項指標遠超英偉達同期產品09-18

藍思科技攜手Rokid打造智能眼鏡,亮相東博會展現科技文化融合魅力由藍思科技與Rokid共同開發的Rokid Glasses智能眼鏡作為大會指定貴賓禮品正式亮相,展現了中國智能制造的技術水平與創新實力。產品采用衍射光波導顯示技術,在保持高透光率的同時實現高清晰度顯示,并搭載…09-18

類腦研究新突破:解鎖大腦奧秘,推動人工智能邁向“自我思考”時代復旦大學類腦智能科學與技術研究院院長馮建峰曾介紹:“現在的人工智能,仍停滯于機器的概念。在這里,馮建峰和諸多科研團隊正在破解一個個“腦奧秘”:比如,研究發現,人腦前額葉和枕葉區的灰質體積越小,多動癥的癥狀越嚴…09-18

技術革新與政策助力雙輪驅動:倉儲機器人重塑物流產業新生態同期發布的《“十四五”機器人產業發展規劃》,更是明確將提高產業創新能力、夯實產業發展基礎、增加高端產品供給等作為主要任務;在“機器人+”應用行動中,提出要深耕倉儲物流等重點行業的應用;在機器人創新產品發展行…09-18

宇樹科技杜鑫峰:機器人“進廠打工”成趨勢,數據采集難題待解9 月 18 日消息,據每日經濟新聞今天報道,2025 世界儲能大會今天在寧德開幕,其中宇樹科技副總經理杜鑫峰在大會上發表演講。 杜鑫峰表示,宇樹科技的機器人現在廣泛應用于文娛表演方面,同時在工業巡…09-18

北自科技攜手星動紀元:人形機器人開啟智能物流新時代探索之旅星動紀元有清華技術基因,陳建宇教授團隊在研發上實力強勁;北自科技則具備場景落地能力,雙方結合能將技術與應用深度融合,實現人形機器人技術在物流工業場景中的落地。 陳建宇:星動紀元與北自科技的技術協同,將探索和挖…09-18

華為發布靈衢互聯協議與系列超節點,引領AI算力基礎設施新變革09-18ICPC總決賽AI大放異彩!GPT-5組合滿分奪冠,人類賽場角逐第三席位09-18微盟集團獲2億美金長線投資,聚焦AI研發與出海,CEO展望全球科技新篇章09-18DeepSeek登《Nature》封面引關注 梁文鋒帶隊回應爭議 開啟AI推理新征程09-18華為徐直軍:Atlas 950超節點算力強勁,多項指標遠超英偉達同類產品09-18

?我國科研團隊攻克難關 研發“神經蠕蟲”電極開啟生物電子接口新范式?

濰坊青州云門山景區:重載無人機助力施工 突破地形難題提速增效

技術革新與政策助力雙輪驅動:倉儲機器人重塑物流產業新生態

宇樹科技杜鑫峰:機器人“進廠打工”成趨勢,數據采集難題待解

北自科技攜手星動紀元:人形機器人開啟智能物流新時代探索之旅

南京浦口中專學校新設無人機專業,產教融合助學子逐夢低空藍天
熱門內容- 熱度攀升!千億科技龍頭頻獲機構調研,業務增長透露哪些行業新動向?
- 蘋果加速AI布局,或收購兩家法國AI初創企業
- DeepSeek V3.1大模型升級,適配國產新芯片,性能顯著提升
- 蘋果秋季發布會亮相iPhone 17系列:"史上最薄"Air登場,Pro Max 2TB版定價17999元
- ?小米16系列或提前登場,首發驍龍8 Elite Gen5,9月機圈大戰一觸即發?
- 國金證券:A股第三輪重估腳步臨近,三類資產投資方向值得關注
- 蘋果加速布局中國市場!Apple Intelligence和新版Siri或年底至明年上線
- 蘋果AI布局加速,或將斥巨資收購歐洲兩大AI初創企業
- 紅米Note15系列前瞻:7s芯片、7000mAh大電池,防水新標桿即將登場
- WAVE SUMMIT大會新動態:文心大模型X1.1上線,多項能力顯著躍升
- 華為智能手表登頂全球,蘋果需直面挑戰求變革
- 科創板AI基金8月22日凈值飆升7.79%,重倉股表現搶眼
- ?字節跳動千人芯片團隊架構調整,轉至新加坡子公司Picoheart引關注?
- vivo X300系列新機入網:首發LYT-828+2億像素,衛通版支持北斗衛星短信
- OpenAI沖刺5000億估值,GPT-5遇冷:資本狂歡與技術瓶頸的碰撞
本欄最新
北自科技攜手星動紀元:人形機器人開啟智能物流新時代探索之旅

華為發布靈衢互聯協議與系列超節點,引領AI算力基礎設施新變革

DeepSeek-R1論文登Nature封面:AI大模型研究邁向科學嚴謹新階段

華為發布《AIDC機房參考設計白皮書》,為AI算力設施建設指明新方向

華為坤靈“4+10+N”方案出爐,一站式助力中小企業邁向智能世界
本文鏈接:http://www.rrqrq.com/showinfo-45-27815-0.html通義DeepResearch重磅登場:性能比肩海外旗艦,模型框架方案全面開源共享
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 平頭哥AI芯片PPU登上《新聞聯播》,亮相次日阿里港股市值達3.02萬億港元
下一篇: 宇樹科技杜鑫峰:機器人從文娛到工業,在電網儲能等場景展身手