前一陣子,大模型競(jìng)技場(chǎng) LMArena 里面悄咪咪地出現(xiàn)了一個(gè)神秘的圖片模型 —— nano-banana,在一眾生圖模型里面亂殺。
這個(gè)小香蕉無(wú)名無(wú)姓,可一旦在 LMArena 抽到它,對(duì)手必被吊打。

這個(gè)神秘的模型在生圖一致性上強(qiáng)得驚人,對(duì)提示詞的理解和完成度也好得可怕。大伙兒你一票我一票,迅速把它送上了榜單第一位。
就在眾人紛紛猜測(cè)新模型到底出身哪個(gè)高門大戶的時(shí)候,谷歌 AI Studio 的產(chǎn)品 Leader 跳出來(lái)發(fā)了一個(gè)香蕉,暗戳戳地認(rèn)領(lǐng)了 nano-banana。

而就在昨天,nano-banana 終于正式上線谷歌 AI Studio,直接去 Gemini 那里就能玩,不用競(jìng)技場(chǎng)費(fèi)事抽卡了。
谷歌在官方博客里是這么秀肌肉的:開局一張臉,以后不管是啥場(chǎng)景,啥服裝,啥表情,都能讓人一眼看出來(lái)你還是你。

把幾張照片搓在一起,生成的結(jié)果既能保證原來(lái)的形象不崩,又能保證新圖片看起來(lái)不違和。

還能多輪對(duì)話改同一張圖,每次只改一點(diǎn)點(diǎn),其它部分就像是媽生原圖一樣,絲毫不變。

官方的案例看起來(lái)是挺吊的,還沒玩上的差友也別急,咱這就帶大伙兒一起體驗(yàn)一下。
為了感受一下其它模型和 nano-banana 的差距,我們先上 LMArena 去抽了幾波卡。
結(jié)果是,一共抽了十幾輪,只要謎底里有 banana,你一定會(huì)盲選 banana。。。有些對(duì)比還是非常慘烈的。
像是讓人物手里加一根香蕉,右邊 seededit 的手崩了,香蕉的顏色也過于鮮艷,和整體畫風(fēng)不搭,但左邊基本挑不出啥毛病。

再比如讓魯迅不要抽煙改拿筆,右邊這個(gè)細(xì)節(jié)變了一堆不說(shuō),筆頭還冒著煙呢。

這么看來(lái),nano-banana 比現(xiàn)在的生圖模型都強(qiáng)是沒啥疑問的。但它具體強(qiáng)在哪些方面呢?我們又去谷歌 Studio 有針對(duì)性地測(cè)了測(cè)。
先說(shuō)結(jié)論,我們覺得 nano-banana 強(qiáng)的點(diǎn),是它對(duì)圖片有了更深入的理解,保證了一致性。而在強(qiáng)一致性的基礎(chǔ)上,修圖、換風(fēng)格、做 3D 手辦。。。它非常全面,啥都干得挺好。
比如這種一鍵試穿,需要把平鋪的各種服飾 P 到人的身上,而 nano-banana 對(duì)細(xì)節(jié)的把控非常到位。
鞋本來(lái)提供的是側(cè)面圖,但它畫出了正面的樣子。服飾上各種 logo 拼的都是對(duì)的,甚至 T 恤上原本鏡像的 ‘SAINT LAURENT’,在生圖的過程中也變回來(lái)了。

我們還試了試人臉的不同角度生成,這個(gè)效果是真的很厲害。
下面這三張圖,只有第一張是真實(shí)照片,后面兩張都是生成的。

這種面部方向的調(diào)整在老模型里是很難實(shí)現(xiàn)的,因?yàn)橐ㄟ^一張平面圖理解一張立體的臉各個(gè)角度長(zhǎng)啥樣很難,但 nano-banana 的完成度也非常高。
另外,我們還測(cè)了一些合照拉郎配。
可以看得出,在這種合照里,它做的不只是把兩個(gè)人物拼在一起,而是學(xué)習(xí)到了面部特征。這樣生成的新圖片即使表情不太樣,還是能讓人一眼看出這是小馬小札。

還有大伙兒愛的 3D 手辦系列,分分鐘把 100 多斤的火鍋壓縮成茶杯犬,化身桌面可愛小擺件,火鍋群里的同事們紛紛求出貨。

牛的還屬這一張 —— 火鍋前陣子右后腿皮膚病剃禿了一塊,而生成的圖片居然注意到了這一點(diǎn),一致性真拉滿了。

不過有一說(shuō)一,nano-banana 的圖像風(fēng)格變換比較中規(guī)中矩,倒是沒啥特別的。
但在這個(gè)過程中,我們發(fā)現(xiàn)它不光在處理圖片,還在偷偷 “ 認(rèn)人 ”。
像是下面這張圖,在我們沒有告訴誰(shuí)是誰(shuí)的情況下,它還是認(rèn)出來(lái)左邊是搞火箭的馬斯克,右邊是 META 的扎克伯格。

我們又試了幾個(gè)地標(biāo)開盒,看看它有沒有 GPT 那樣的推理能力。

但實(shí)際上它只在地標(biāo)建筑物上比較好使,更像是圖像識(shí)別 + 記憶檢索,只能說(shuō)有一點(diǎn)推理能力,但不多。
左 nano-banana 答錯(cuò),右 GPT 5 Thinking 答對(duì)
除了上述的優(yōu)點(diǎn),它的缺點(diǎn)其實(shí)也不少。。。大的問題就是,谷歌好像給它做了不少安全性調(diào)教,經(jīng)常這也不行,那也不行,有時(shí)候真摸不清哪個(gè)關(guān)鍵詞又觸犯天條了。

其次是對(duì)提示詞要求比較高,往好了說(shuō),是 nano-banana 對(duì)提示詞的遵循能力強(qiáng),但實(shí)際上對(duì)用戶來(lái)講,得多花不少時(shí)間打磨提示詞,有點(diǎn)折磨。
谷歌自己也表示,別讓 Gemini 猜你的心思,有啥想要的盡管說(shuō)出來(lái)。

所以要是出來(lái)的效果不好,寫提示詞的時(shí)候就得盡量詳細(xì)一些,什么要?jiǎng)樱裁床灰獎(jiǎng)油ㄍ忻靼祝拍鼙WC強(qiáng)一致性。
后,比起咱心目中的 P 圖白月光 FLUX,它在局部小范圍修圖上效果還是差了一點(diǎn),所以還是建議大伙兒精修找 FLUX,上面各種整大活兒再用 nano-banana。
左原圖,中 nano-banana,右 FLUX
總的來(lái)說(shuō),nano-banana 強(qiáng)就強(qiáng)在它對(duì)圖片的理解能力是目前好的,而且各種任務(wù)上的一致性都不錯(cuò),沒有大短板。
更大的好消息是,小香蕉已經(jīng)被整合進(jìn)了 2.5 Flash 版本,即使沒有 pro 會(huì)員,免費(fèi)的賬戶也可以使用。
只要左上角選擇 2.5 Flash,對(duì)話框 tools 選擇 Image 即可。

LMAreana 上也依然可用,只要 prompt 開頭輸入 “ 使用 nano-banana 模型生成 ” ,有極高概率可以抽到。
或者有些整合網(wǎng)站像是 LibLib,F(xiàn)al-ai 等等也有第三方提供的 nano-banana。

感興趣的差友趕緊去試試吧,歡迎回來(lái)評(píng)論區(qū)返圖哦。
本文鏈接:http://www.rrqrq.com/showinfo-17-179329-0.html隱姓埋名的小香蕉 悄悄吊著打所有生圖模型!
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 踴躍去消費(fèi)!多家銀行宣布下調(diào)人民幣存款利率:定存利率進(jìn)入1時(shí)代 還會(huì)降