Nano Banana 2: Pro-szintű képminőség, Flash-sebességgel a Google-nál

A Google DeepMind bemutatta a Nano Banana 2-t (Gemini 3.1 Flash Image), amely a Pro képességeit hozza el jóval gyorsabb generálással és szerkesztéssel. Az új modell több Google-termékben alapértelmezetté válik, miközben a Pro verzió speciális feladatokra megmarad a fizetős csomagokban.

Ha eddig az volt a dilemmád, hogy a gyors képmodellek „elég jók-e”, a pontosabbak pedig „elég gyorsak-e”, a Google most azt állítja: a Nano Banana 2-vel ez a kompromisszum jóval kisebb lett.

Mi történt

A Google DeepMind bejelentette a Nano Banana 2-t, amely a cég megfogalmazása szerint a legújabb „state-of-the-art” képmodelljük, és technikailag Gemini 3.1 Flash Image néven fut. A pozicionálás lényege: a korábbi Nano Banana Pro „okosságát” (világismeret, minőség, következtetés) hozza, de Flash-sebességgel, vagyis gyors generálással és gyors iterációval.

A DeepMind szerint a modell több, korábban „Pro-exkluzív” képességet szélesebb körben elérhetővé tesz. Kiemelik az advanced world knowledge részt: a modell a Gemini „valós világbeli tudásbázisára” támaszkodik, és webes keresésből származó, valós idejű információkkal és képekkel is „groundolható” (gondolj rá úgy, mint egy hivatkozási alapra: a modell nem csak kitalál, hanem megpróbál konkrét, friss webes találatokhoz igazodni). A cél, hogy pontosabban tudjon megjeleníteni specifikus témákat, és olyan feladatoknál is használható legyen, mint infografikák készítése, jegyzetek diagrammá alakítása, adatvizualizációk generálása.

A másik nagy ígéret a precíz szövegmegjelenítés és fordítás. A közlemény szerint a Nano Banana 2 olvasható, pontos szöveget tud képre tenni (például marketing-mockupokra vagy üdvözlőkártyákra), és képen belüli szöveget le tud fordítani és lokalizálni. (A „lokalizálás” itt nem csak fordítást jelent, hanem azt is, hogy a szöveg a célpiac nyelvi-kulturális elvárásaihoz igazodjon.)

A DeepMind a kreatív kontroll terén is sorol fejlesztéseket:

Tárgy- és szereplőkonzisztencia: állításuk szerint akár öt karakter hasonlóságát és akár 14 objektum „hűségét” képes egy munkafolyamaton belül megtartani. Ez storyboardoknál, narratív képsoroknál fontos: ne „cserélődjön le” a szereplő arca vagy a tárgy formája képről képre.
Pontosabb utasításkövetés: komplexebb kéréseknél szorosabban ragaszkodik a megadott részletekhez (azaz kisebb az esélye, hogy „félreérti” a promptot).
Gyártásra kész specifikációk: többféle képarány és felbontás támogatása 512 px-től 4K-ig, hogy a végeredmény alkalmas legyen például álló social posztra vagy szélesvásznú háttérre.
Vizuális minőségjavulás: élénkebb fények, gazdagabb textúrák, élesebb részletek – mindez a Flash-től elvárt sebesség mellett.

A bevezetés kifejezetten széles: a Nano Banana 2 „ma” indul több Google-felületen.

Gemini app: a Nano Banana 2 leváltja a Nano Banana Pro-t a Fast, Thinking és Pro modellekben. A Google AI Pro és Ultra előfizetők továbbra is elérik a Nano Banana Pro-t speciális feladatokra: a képgenerálásnál a hárompontos menüből lehet újragenerálni Pro-val.
Search: AI Mode és Lens alatt, Google appban és mobil/desktop böngészőben is; a cég 141 új országot és területet, valamint 8 új nyelvet említ.
AI Studio + API: previewként az AI Studio-ban és a Gemini API-n; külön árazással.
Google Cloud / Vertex AI: previewként a Gemini API-n keresztül.
Flow: alapértelmezett képmodell, minden Flow felhasználónak 0 kreditért.
Google Ads: kampánykészítés közben javaslatokat „hajt” (azaz a kreatív javaslatoknál használják).

Végül a DeepMind külön blokkban foglalkozik a provenance-szal, vagyis a származás és eredet jelölésével/ellenőrzésével. Azt írják, a SynthID (Google-féle, AI-tartalmakba ágyazott jelölési technológia) mellé C2PA Content Credentials (iparági szabványos metaadat/„tartalmi igazolvány”) támogatást társítanak, hogy ne csak azt lehessen látni, készült-e AI-jal valami, hanem azt is, hogyan.

Konkrét számot is adnak: a Gemini appban a SynthID verification funkciót novemberi indulása óta több mint 20 millió alkalommal használták különböző nyelveken. Azt is jelzik, hogy hamarosan a C2PA ellenőrzést is elhozzák a Gemini appba.

Miért fontos

A képmodelleknél a mindennapi használhatóság gyakran nem a „legszebb egyetlen kép” kérdése, hanem az iterációé: mennyi idő alatt tudsz eljutni a jó verzióig. A Google üzenete az, hogy a Nano Banana 2-vel a gyors munkamenetek (gyors javítások, sok körös finomítás) közben is megmarad a Pro-közeli minőség és „értelmesség”. Ez különösen ott számít, ahol a kép nem öncélú mű, hanem munkaeszköz: prezentáció, kampánykreatív, termékoldal, vagy akár egy gyors, érthető diagram.

A másik fontos szál a képen belüli szöveg. A generatív modellek látványban sokat fejlődtek, de a torz, olvashatatlan feliratok sokáig tipikus hibák voltak. Ha a Nano Banana 2 tényleg stabilabban ad pontos tipográfiát és fordítást, az közelebb viszi a „kész asset” jelleghez: kevesebb utómunka kell grafikai szoftverben.

És ott van az eredetjelölés: a SynthID + C2PA párosítás azt jelzi, hogy a Google nem csak generálni akar, hanem azonosíthatóvá is tenni a generált tartalmakat. Gondolj rá úgy, mint egy digitális „gyártási címkére”: nem feltétlenül akadályozza meg a visszaélést, de segíthet a platformoknak és a felhasználóknak ellenőrizni, mi honnan jött.

Mire figyelj

Három dolgot érdemes követni a következő hetekben:

a Nano Banana 2 „webes kereséssel groundolt” működése mennyire lesz következetesen pontos különböző témákban
a szövegmegjelenítés és lokalizáció mennyire állja meg a helyét valós marketing- és termékes környezetben
a C2PA ellenőrzés Gemini appba érkezése milyen részletességgel mutatja majd meg a tartalom „hogyanját” (milyen szerkesztések, milyen eszközlánc), és ez mennyire lesz kompatibilis más platformok ellenőrző eszközeivel