4 月 18 日消息,谷歌公司昨日(4 月 17 日)發(fā)布公告,宣布在 Google AI Studio 和 Vertex AI 中,以 Gemini API 的方式推出 Gemini 2.5 Flash Preview 預(yù)覽 AI 模型。
用戶還可通過 Gemini 應(yīng)用內(nèi)的模型選擇器直接使用,并結(jié)合 Canvas 工具優(yōu)化文檔和代碼編輯。
此前報(bào)道,Gemini 2.5 Flash 是一個混合推理模型,具備“動態(tài)且可控”的計(jì)算能力,開發(fā)者能夠根據(jù)查詢請求的復(fù)雜程度靈活調(diào)整處理時間。

谷歌指出,Gemini 2.5 Flash 非常適合用于“高容量”和“實(shí)時”的應(yīng)用場景,例如客戶服務(wù)和文檔解析。谷歌在其博客文章中提到:“這款工作型模型專門針對低延遲和降低成本進(jìn)行了優(yōu)化,是響應(yīng)式虛擬助手和實(shí)時總結(jié)工具的理想引擎”。

根據(jù)谷歌官方公布的定價,Gemini 2.5 Flash 模型每 100 萬 tokens 輸入為 0.15 美元,每 100 萬 tokens 輸出(不含推理)為 0.6 美元、每 100 萬 tokens 輸出(含推理)為 3.5 美元.
作為首款全混合推理模型,開發(fā)者可根據(jù)需求開關(guān)推理功能,靈活調(diào)整響應(yīng)質(zhì)量、成本和延遲,與 Anthropic 和 Grok 的前沿模型相比,Gemini 2.5 Flash 成本更低但表現(xiàn)不俗。
本文鏈接:http://www.rrqrq.com/showinfo-45-12420-0.html谷歌 Gemini 2.5 Flash 混合推理 AI 模型上線:性能成本雙優(yōu)
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:[email protected]