Mi történt
A Google DeepMind bejelentette a Nano Banana 2-t, amely a cég megfogalmazása szerint a legújabb „state-of-the-art” képmodelljük, és technikailag Gemini 3.1 Flash Image néven fut. A pozicionálás lényege: a korábbi Nano Banana Pro „okosságát” (világismeret, minőség, következtetés) hozza, de Flash-sebességgel, vagyis gyors generálással és gyors iterációval.A DeepMind szerint a modell több, korábban „Pro-exkluzív” képességet szélesebb körben elérhetővé tesz. Kiemelik az advanced world knowledge részt: a modell a Gemini „valós világbeli tudásbázisára” támaszkodik, és webes keresésből származó, valós idejű információkkal és képekkel is „groundolható” (gondolj rá úgy, mint egy hivatkozási alapra: a modell nem csak kitalál, hanem megpróbál konkrét, friss webes találatokhoz igazodni). A cél, hogy pontosabban tudjon megjeleníteni specifikus témákat, és olyan feladatoknál is használható legyen, mint infografikák készítése, jegyzetek diagrammá alakítása, adatvizualizációk generálása.
A másik nagy ígéret a precíz szövegmegjelenítés és fordítás. A közlemény szerint a Nano Banana 2 olvasható, pontos szöveget tud képre tenni (például marketing-mockupokra vagy üdvözlőkártyákra), és képen belüli szöveget le tud fordítani és lokalizálni. (A „lokalizálás” itt nem csak fordítást jelent, hanem azt is, hogy a szöveg a célpiac nyelvi-kulturális elvárásaihoz igazodjon.)
A DeepMind a kreatív kontroll terén is sorol fejlesztéseket:
- Tárgy- és szereplőkonzisztencia: állításuk szerint akár öt karakter hasonlóságát és akár 14 objektum „hűségét” képes egy munkafolyamaton belül megtartani. Ez storyboardoknál, narratív képsoroknál fontos: ne „cserélődjön le” a szereplő arca vagy a tárgy formája képről képre.
- Pontosabb utasításkövetés: komplexebb kéréseknél szorosabban ragaszkodik a megadott részletekhez (azaz kisebb az esélye, hogy „félreérti” a promptot).
- Gyártásra kész specifikációk: többféle képarány és felbontás támogatása 512 px-től 4K-ig, hogy a végeredmény alkalmas legyen például álló social posztra vagy szélesvásznú háttérre.
- Vizuális minőségjavulás: élénkebb fények, gazdagabb textúrák, élesebb részletek – mindez a Flash-től elvárt sebesség mellett.
- Gemini app: a Nano Banana 2 leváltja a Nano Banana Pro-t a Fast, Thinking és Pro modellekben. A Google AI Pro és Ultra előfizetők továbbra is elérik a Nano Banana Pro-t speciális feladatokra: a képgenerálásnál a hárompontos menüből lehet újragenerálni Pro-val.
- Search: AI Mode és Lens alatt, Google appban és mobil/desktop böngészőben is; a cég 141 új országot és területet, valamint 8 új nyelvet említ.
- AI Studio + API: previewként az AI Studio-ban és a Gemini API-n; külön árazással.
- Google Cloud / Vertex AI: previewként a Gemini API-n keresztül.
- Flow: alapértelmezett képmodell, minden Flow felhasználónak 0 kreditért.
- Google Ads: kampánykészítés közben javaslatokat „hajt” (azaz a kreatív javaslatoknál használják).
Konkrét számot is adnak: a Gemini appban a SynthID verification funkciót novemberi indulása óta több mint 20 millió alkalommal használták különböző nyelveken. Azt is jelzik, hogy hamarosan a C2PA ellenőrzést is elhozzák a Gemini appba.
Miért fontos
A képmodelleknél a mindennapi használhatóság gyakran nem a „legszebb egyetlen kép” kérdése, hanem az iterációé: mennyi idő alatt tudsz eljutni a jó verzióig. A Google üzenete az, hogy a Nano Banana 2-vel a gyors munkamenetek (gyors javítások, sok körös finomítás) közben is megmarad a Pro-közeli minőség és „értelmesség”. Ez különösen ott számít, ahol a kép nem öncélú mű, hanem munkaeszköz: prezentáció, kampánykreatív, termékoldal, vagy akár egy gyors, érthető diagram.A másik fontos szál a képen belüli szöveg. A generatív modellek látványban sokat fejlődtek, de a torz, olvashatatlan feliratok sokáig tipikus hibák voltak. Ha a Nano Banana 2 tényleg stabilabban ad pontos tipográfiát és fordítást, az közelebb viszi a „kész asset” jelleghez: kevesebb utómunka kell grafikai szoftverben.
És ott van az eredetjelölés: a SynthID + C2PA párosítás azt jelzi, hogy a Google nem csak generálni akar, hanem azonosíthatóvá is tenni a generált tartalmakat. Gondolj rá úgy, mint egy digitális „gyártási címkére”: nem feltétlenül akadályozza meg a visszaélést, de segíthet a platformoknak és a felhasználóknak ellenőrizni, mi honnan jött.
Mire figyelj
Három dolgot érdemes követni a következő hetekben:- a Nano Banana 2 „webes kereséssel groundolt” működése mennyire lesz következetesen pontos különböző témákban
- a szövegmegjelenítés és lokalizáció mennyire állja meg a helyét valós marketing- és termékes környezetben
- a C2PA ellenőrzés Gemini appba érkezése milyen részletességgel mutatja majd meg a tartalom „hogyanját” (milyen szerkesztések, milyen eszközlánc), és ez mennyire lesz kompatibilis más platformok ellenőrző eszközeivel
