谷歌在近日悄然推出了Gemini 2.5 Pro的重大更新版本——Gemini 2.5 Pro Preview 06-05 Thinking,這一舉動(dòng)在AI界掀起了波瀾。據(jù)悉,新版本在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)卓越,特別是在推理能力、科學(xué)以及編程能力方面,成功超越了OpenAI的o3、DeepSeek R1和Claude Opus 4等強(qiáng)勁對(duì)手。
據(jù)谷歌官方透露,Gemini 2.5 Pro Preview 06-05 Thinking在編程能力上尤為突出,領(lǐng)跑包括Aider Polyglot在內(nèi)的高難度編程基準(zhǔn)測(cè)試。這一成就不僅彰顯了谷歌在AI技術(shù)領(lǐng)域的深厚積累,也預(yù)示著大模型迭代速度的進(jìn)一步加快。
在價(jià)格策略上,新版本延續(xù)了先前的定價(jià)方案,即每百萬token輸入(無緩存)費(fèi)用為1.25美元,輸出費(fèi)用為10美元。盡管這一價(jià)格相較于部分競(jìng)爭(zhēng)對(duì)手仍顯偏高,但考慮到其卓越的性能表現(xiàn),仍吸引了大量開發(fā)者和用戶的關(guān)注。
谷歌CEO桑達(dá)爾·皮查伊在海外社交媒體上親自宣布了這一消息,他表示:“我們最新的Gemini 2.5 Pro更新現(xiàn)已發(fā)布預(yù)覽版……我們聽取了用戶的反饋,并對(duì)回答的風(fēng)格和結(jié)構(gòu)進(jìn)行了改進(jìn)。大家可以在AI Studio、Vertex AI平臺(tái)和Gemini app中進(jìn)行試用。正式版即將推出!”
在基準(zhǔn)測(cè)試方面,Gemini 2.5 Pro Preview 06-05 Thinking的表現(xiàn)堪稱驚艷。它不僅在文本、視覺、網(wǎng)頁開發(fā)、編程、數(shù)學(xué)、創(chuàng)意、多輪對(duì)話、指令跟隨及長(zhǎng)查詢等多個(gè)類別中拔得頭籌,還在綜合榜單上以顯著優(yōu)勢(shì)領(lǐng)先。特別是在WebDevArena測(cè)試中,其Elo分?jǐn)?shù)高達(dá)1443分,較此前版本有了大幅提升。
盡管新版本在多項(xiàng)測(cè)試中表現(xiàn)出色,但在某些特定領(lǐng)域仍有提升空間。例如,在測(cè)試數(shù)學(xué)能力的AIME 2025和測(cè)試代碼生成的LiveCodeBench上,它并未超過OpenAI的o3和o4-mini。不過,這并不影響其作為當(dāng)前最強(qiáng)大的AI模型之一的地位。

隨著Gemini 2.5 Pro Preview 06-05 Thinking的推出,開發(fā)者們已經(jīng)迫不及待地開始嘗試這一新版本。從圖像生成到編程應(yīng)用,新版本都展現(xiàn)出了驚人的能力和創(chuàng)造力。例如,有開發(fā)者使用Gemini生成了一張生動(dòng)的獅子特寫照片,還有開發(fā)者要求其編寫了一個(gè)模擬隨機(jī)車流量單行道上的交通信號(hào)燈運(yùn)作過程的Python程序,結(jié)果都令人驚嘆不已。

這一系列卓越的表現(xiàn)無疑進(jìn)一步鞏固了谷歌在AI領(lǐng)域的領(lǐng)先地位。隨著大模型迭代速度的加快,未來的AI較量將更加激烈和精彩。而Gemini 2.5 Pro Preview 06-05 Thinking的推出,無疑為這一競(jìng)爭(zhēng)注入了新的活力和動(dòng)力。























本文鏈接:http://www.rrqrq.com/showinfo-45-13525-0.htmlGemini 2.5 Pro新版再突破!谷歌AI實(shí)力領(lǐng)跑行業(yè)基準(zhǔn)測(cè)試
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:[email protected]