百度智能云千帆平臺(tái)近日宣布,面向企業(yè)級(jí)多模態(tài)應(yīng)用場(chǎng)景的全新視覺(jué)理解大模型Qianfan-VL正式開(kāi)源。該系列模型包含3B、8B、70B三種參數(shù)規(guī)格,通過(guò)深度優(yōu)化設(shè)計(jì),在基礎(chǔ)通用能力與產(chǎn)業(yè)垂直場(chǎng)景中均展現(xiàn)出顯著優(yōu)勢(shì)。目前8B與70B版本已開(kāi)放免費(fèi)體驗(yàn),企業(yè)用戶和開(kāi)發(fā)者可在10月10日前登錄平臺(tái)進(jìn)行試用。
研發(fā)團(tuán)隊(duì)基于開(kāi)源架構(gòu)進(jìn)行創(chuàng)新開(kāi)發(fā),依托百度自研的昆侖芯P800芯片構(gòu)建了超大規(guī)模分布式計(jì)算系統(tǒng)。該系統(tǒng)支持單任務(wù)5000卡并行計(jì)算,通過(guò)優(yōu)化并行策略與算子設(shè)計(jì),顯著提升了模型處理復(fù)雜算法與海量數(shù)據(jù)的效率。這種軟硬件協(xié)同的創(chuàng)新模式,使模型在通用與垂類(lèi)任務(wù)評(píng)測(cè)中均達(dá)到行業(yè)領(lǐng)先水平。
模型設(shè)計(jì)采用四階段能力增強(qiáng)訓(xùn)練方案,在保持通用性能的同時(shí),針對(duì)產(chǎn)業(yè)落地需求進(jìn)行專項(xiàng)強(qiáng)化。通過(guò)構(gòu)建覆蓋文檔識(shí)別、數(shù)學(xué)解題、圖表理解等核心任務(wù)的高精度數(shù)據(jù)合成管線,實(shí)現(xiàn)了高質(zhì)量訓(xùn)練數(shù)據(jù)的規(guī)模化生產(chǎn)。這種訓(xùn)練策略使模型參數(shù)規(guī)模與性能呈現(xiàn)顯著正相關(guān),70B版本在專業(yè)領(lǐng)域問(wèn)答中展現(xiàn)出更強(qiáng)的推理能力。
在OCR全場(chǎng)景識(shí)別方面,模型可精準(zhǔn)處理手寫(xiě)體、數(shù)學(xué)公式、自然場(chǎng)景文字等多種類(lèi)型,并能對(duì)卡證票據(jù)進(jìn)行結(jié)構(gòu)化信息提取。復(fù)雜版面文檔理解能力尤為突出,可自動(dòng)解析表格圖表、實(shí)現(xiàn)文檔智能問(wèn)答與結(jié)構(gòu)化解析。基準(zhǔn)測(cè)試顯示,其在OCRBench等專業(yè)評(píng)測(cè)中的表現(xiàn)隨參數(shù)規(guī)模提升持續(xù)優(yōu)化,為金融、醫(yī)療等領(lǐng)域的文檔處理提供了高效解決方案。
8B與70B版本特有的思維鏈激活功能,通過(guò)特殊token設(shè)計(jì)支持復(fù)雜場(chǎng)景的組合推理。在數(shù)學(xué)解題領(lǐng)域,模型可實(shí)現(xiàn)幾何推理、公式識(shí)別與分步求解;在圖表分析方面,能完成數(shù)據(jù)趨勢(shì)預(yù)測(cè)、關(guān)聯(lián)推理及統(tǒng)計(jì)計(jì)算。測(cè)試數(shù)據(jù)顯示,這兩個(gè)版本在MathVista-mini等數(shù)學(xué)視覺(jué)基準(zhǔn)測(cè)試中的準(zhǔn)確率較主流模型有顯著提升。
該系列模型的多尺寸設(shè)計(jì)充分考慮到不同規(guī)模企業(yè)的應(yīng)用需求。3B版本適用于輕量級(jí)部署場(chǎng)景,8B版本在性能與效率間取得平衡,70B版本則能滿足高精度要求的復(fù)雜任務(wù)。這種分級(jí)設(shè)計(jì)使教育、金融、工業(yè)等領(lǐng)域的用戶都能找到適配方案,有效降低了企業(yè)應(yīng)用AI技術(shù)的門(mén)檻。
目前,模型已在OCR識(shí)別、文檔理解等場(chǎng)景形成典型應(yīng)用案例。在票據(jù)處理場(chǎng)景中,可自動(dòng)提取關(guān)鍵信息并完成結(jié)構(gòu)化錄入;在學(xué)術(shù)文檔分析場(chǎng)景,能精準(zhǔn)解析復(fù)雜版面并支持智能問(wèn)答。研發(fā)團(tuán)隊(duì)透露,后續(xù)將持續(xù)優(yōu)化視頻理解、三維場(chǎng)景解析等能力,推動(dòng)模型在更多產(chǎn)業(yè)領(lǐng)域的深度應(yīng)用。
更多>同類(lèi)資訊Orange Research DivMerge技術(shù):智能拼裝AI模型,解鎖多任務(wù)處理新境界09-23復(fù)旦大學(xué)AgentGym-RL框架:小模型大智慧,AI智能體學(xué)會(huì)復(fù)雜任務(wù)長(zhǎng)期規(guī)劃09-23Meta實(shí)驗(yàn)室新突破:AI模型開(kāi)啟"自我對(duì)弈"模式,不依賴數(shù)據(jù)也能持續(xù)進(jìn)化09-23聯(lián)發(fā)科天璣9500首推雙NPU架構(gòu),讓AI常駐手機(jī)開(kāi)啟主動(dòng)服務(wù)新體驗(yàn)09-23DeepSeek-V3.1升級(jí)至Terminus版 優(yōu)化語(yǔ)言一致性及Agent能力09-23斯坦福等高校聯(lián)手:用LMEnt套件追蹤AI語(yǔ)言模型知識(shí)學(xué)習(xí)軌跡09-23AI搜索的數(shù)學(xué)邊界:當(dāng)最強(qiáng)大模型遇上"簡(jiǎn)單問(wèn)題"的隱秘困局09-23中科院團(tuán)隊(duì)創(chuàng)新CARVE法:破解AI視覺(jué)“分心”難題,助模型精準(zhǔn)聚焦09-23Plaud攜三款A(yù)I紀(jì)要新品入局大陸市場(chǎng),多模態(tài)交互與長(zhǎng)續(xù)航成亮點(diǎn)09-23DeepSeek線上模型升級(jí)至V3.1-Terminus,輸出更穩(wěn)Agent能力再提升09-23DeepSeek-V3.1升級(jí)至V3.1-Terminus:語(yǔ)言更一致,代理更強(qiáng)大,輸出更穩(wěn)定09-23上海人工智能實(shí)驗(yàn)室牽頭!科學(xué)智能戰(zhàn)略科技力量聯(lián)盟正式成立09-23DeepSeek-V3.1-Terminus發(fā)布:修復(fù)Bug,編程與搜索智能體能力再升級(jí)09-23科學(xué)智能戰(zhàn)略科技力量聯(lián)盟成立 共探AI賦能多學(xué)科創(chuàng)新發(fā)展路徑09-23中國(guó)電信引領(lǐng)6G新突破:首個(gè)6G計(jì)費(fèi)項(xiàng)目獲3GPP正式批準(zhǔn)09-23點(diǎn)擊查看更多 +全站最新
?9月狹義乘用車(chē)零售預(yù)計(jì)達(dá)215萬(wàn)輛,新能源車(chē)滲透率或超58%引關(guān)注?
6.88萬(wàn)起極狐T1實(shí)測(cè):空間越級(jí)配置足,小電車(chē)市場(chǎng)殺出“全能王”?
?雷軍官宣小米17系列9月25日發(fā)布,盧偉冰稱產(chǎn)品力跨代升級(jí)且對(duì)標(biāo)iPhone17?
?小米17系列9月25日發(fā)布在即,雷軍年度演講《改變》將揭秘芯片與汽車(chē)故事?
?雷軍宣布:9月25日小米17系列發(fā)布,同期將舉辦第6次年度演講聊芯片與汽車(chē)故事?
小米SU7標(biāo)準(zhǔn)版11.7萬(wàn)輛召回:OTA升級(jí)背后的智能駕駛安全與行業(yè)新挑戰(zhàn)熱門(mén)內(nèi)容
第22屆東博會(huì)AI元素亮眼:數(shù)字智能體引路 機(jī)器人炫技展風(fēng)采
AI云競(jìng)爭(zhēng)下半場(chǎng):華為以超節(jié)點(diǎn)、企業(yè)Agent等破局,誰(shuí)能領(lǐng)跑產(chǎn)業(yè)?
2025網(wǎng)安周:每日互動(dòng)劉宇談AI時(shí)代,知識(shí)安全成關(guān)鍵,共筑數(shù)字新未來(lái)
中國(guó)大模型DeepSeek首登Nature封面,R1訓(xùn)練成本僅約208萬(wàn)引關(guān)注
華為全聯(lián)接大會(huì)2025啟幕,發(fā)布全球最強(qiáng)算力超節(jié)點(diǎn)與集群
有鹿機(jī)器人+連合直租:以智能租賃模式,開(kāi)啟高端場(chǎng)景清潔新未來(lái)
本文鏈接:http://www.rrqrq.com/showinfo-45-27962-0.html百度智能云Qianfan-VL視覺(jué)理解模型開(kāi)源,多尺寸適配多場(chǎng)景助力AI產(chǎn)業(yè)落地
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 立訊精密或參與OpenAI消費(fèi)級(jí)設(shè)備項(xiàng)目 產(chǎn)業(yè)鏈人士證實(shí)已與國(guó)內(nèi)供應(yīng)鏈合作
下一篇: Orange Research DivMerge技術(shù):智能拼裝AI模型,解鎖多任務(wù)處理新境界