在近日于上海新國(guó)際博覽中心圓滿落幕的VisionChina2025(上海)機(jī)器視覺展上,北京阿丘科技的產(chǎn)品總監(jiān)李嘉悅帶來(lái)了一場(chǎng)別開生面的演講,主題聚焦于“大模型驅(qū)動(dòng)的AI檢測(cè)范式變革:大模型、小模型與智能體的協(xié)同進(jìn)化”。此次展會(huì)由機(jī)器視覺產(chǎn)業(yè)聯(lián)盟(CMVU)主辦,慕尼黑展覽(上海)有限公司承辦。

李嘉悅在演講伊始便介紹了自己的身份,并隨即展開了《大模型驅(qū)動(dòng)的AI檢測(cè)范式變革:大模型、小模型與智能體的協(xié)同進(jìn)化》的主題分享。她指出,2019年被視作工業(yè)AI視覺的元年,當(dāng)時(shí)以小模型路線為主的CNN技術(shù)開始在早期客戶中得以應(yīng)用。直至2024年,工業(yè)AI視覺一直在跨越鴻溝,逐漸在各大細(xì)分領(lǐng)域和市場(chǎng)普及,從頭部客戶逐漸覆蓋至腰部客戶,甚至在某些細(xì)分行業(yè)已成為標(biāo)配。然而,盡管認(rèn)知有所改變,AI檢測(cè)應(yīng)用的增長(zhǎng)速度卻相對(duì)緩慢,呈現(xiàn)出線性增長(zhǎng)趨勢(shì),這主要源于小模型技術(shù)路線存在的諸多問題,如樣本收集周期長(zhǎng)、模型迭代周期長(zhǎng)以及模型泛化能力差。
她進(jìn)一步解釋道,工業(yè)缺陷樣本稀缺且收集周期長(zhǎng),非專業(yè)工程師在調(diào)優(yōu)模型時(shí)常面臨不收斂的問題,導(dǎo)致AI落地周期延長(zhǎng)。小模型的泛化能力不足,對(duì)于未見過的樣本往往無(wú)法準(zhǔn)確識(shí)別,這又加劇了樣本收集的難題。這些問題成為制約AI檢測(cè)落地和增長(zhǎng)的關(guān)鍵因素。不過,令人振奮的是,去年AI領(lǐng)域出現(xiàn)了重大技術(shù)突破,通用大模型如雨后春筍般涌現(xiàn),從OpenAI的ChatGPT到豆包、Kimi,再到DeepSeek和Manus智能體,這些大模型引發(fā)了廣泛討論,標(biāo)志著AI技術(shù)來(lái)到了突破點(diǎn)。

談及大模型在工業(yè)檢測(cè)中的應(yīng)用,李嘉悅表示,存在兩種截然不同的聲音。一種保守觀點(diǎn)認(rèn)為,大模型與工業(yè)檢測(cè)無(wú)關(guān),無(wú)法適應(yīng)工業(yè)場(chǎng)景嚴(yán)格的準(zhǔn)確性要求;另一種激進(jìn)觀點(diǎn)則認(rèn)為,大模型能力強(qiáng)大,很快即可直接接入工廠,實(shí)現(xiàn)自動(dòng)化質(zhì)檢。而阿丘科技則認(rèn)為,大模型將加速AI檢測(cè)范式的轉(zhuǎn)變,并與小模型形成協(xié)同關(guān)系。
在科普大模型、小模型、智能體的概念時(shí),李嘉悅指出,小模型通常指?jìng)鹘y(tǒng)的深度學(xué)習(xí)網(wǎng)絡(luò),如CNN等,參數(shù)規(guī)模較小,數(shù)據(jù)處理能力有限,對(duì)數(shù)據(jù)量和數(shù)據(jù)多樣性要求較高,且泛化性能相對(duì)較差。相比之下,大模型采用Transformer等架構(gòu),解決了小模型在長(zhǎng)時(shí)間和遠(yuǎn)距離依賴問題上的不足,參數(shù)規(guī)模龐大,能夠接收多模態(tài)數(shù)據(jù),對(duì)數(shù)據(jù)中的噪聲和不一致性具有較強(qiáng)的魯棒性,具有出色的泛化性能。智能體則是大模型應(yīng)用的一種包裝形式,可以自主完成一系列動(dòng)作以達(dá)成目標(biāo)。
在探討工業(yè)視覺如何運(yùn)用大小模型時(shí),李嘉悅表示,通用AI大模型雖然通過大量互聯(lián)網(wǎng)數(shù)據(jù)訓(xùn)練,但在工業(yè)檢測(cè)中準(zhǔn)確度通常較差。然而,有機(jī)會(huì)構(gòu)建專門的工業(yè)檢測(cè)大模型,這類模型類似于行業(yè)大模型,能夠?qū)W習(xí)到各行各業(yè)、各種制造領(lǐng)域中不同產(chǎn)品的各種缺陷知識(shí),在工業(yè)檢測(cè)領(lǐng)域具有很強(qiáng)的泛化能力。還有場(chǎng)景大模型,這類模型學(xué)習(xí)了一定規(guī)模的特定范圍內(nèi)的知識(shí),在準(zhǔn)確度、處理速度和泛化能力方面表現(xiàn)出色。小模型則專注于學(xué)習(xí)特定的知識(shí),優(yōu)勢(shì)在于準(zhǔn)確度高和推理速度快。智能體則可作為自主模型訓(xùn)練的小助手,大幅降低模型迭代的難度和時(shí)間成本。

在介紹阿丘科技的AI模型產(chǎn)品布局時(shí),李嘉悅表示,公司仍然保留小模型方向的產(chǎn)品,并提供開發(fā)工具套件,如AIDI等軟件工具型產(chǎn)品。對(duì)于場(chǎng)景大模型類產(chǎn)品,公司直接提供面向特定場(chǎng)景的端到端即插即用模型。工業(yè)檢測(cè)大模型產(chǎn)品也是今年研發(fā)的重點(diǎn),稱為AQ-VLM,即阿丘的視覺語(yǔ)言模型,分為工業(yè)視覺大模型和通用缺陷生成模型兩個(gè)分支。智能體則更多集成到模型訓(xùn)練開發(fā)平臺(tái)中,將人工重復(fù)性工作轉(zhuǎn)變?yōu)橛芍悄荏w完成。

最后,李嘉悅分享了一個(gè)實(shí)踐案例,以更好地理解大小模型協(xié)同的概念。在金屬結(jié)構(gòu)件檢測(cè)的場(chǎng)景中,針對(duì)明顯的缺陷,直接使用大模型進(jìn)行檢測(cè);對(duì)于不明顯但常見的缺陷,采用VLM加上微調(diào)的方法;對(duì)于不明顯且罕見的缺陷,采用生成式AI結(jié)合小模型和智能體的方法。她強(qiáng)調(diào),這些模型的能力邊界是動(dòng)態(tài)變化的,方案也保持一定的開放性。

























本文鏈接:http://www.rrqrq.com/showinfo-45-12082-0.html大模型時(shí)代來(lái)臨,阿丘科技如何以AI檢測(cè)引領(lǐng)工業(yè)視覺新變革?
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:[email protected]
上一篇: 神雲(yún)科技CITE25展現(xiàn)AI與云端計(jì)算創(chuàng)新方案,驅(qū)動(dòng)數(shù)據(jù)中心效能升級(jí)
下一篇: 中國(guó)科大新成果入選 ICLR 2025:特定領(lǐng)域僅用 5% 訓(xùn)練數(shù)據(jù),知識(shí)準(zhǔn)確率提升 14%