Google a confirmat oficial lansarea unui nou model de generare și editare de imagini bazat pe inteligență artificială, cunoscut în cercurile online drept „Nano-Banana”.
Gemini 2.5 Flash Image, oferǎ funcționalități avansate de editare și generare, şi poate fi accesat în aplicația Gemini, atât pentru utilizatorii gratuit, cât și pentru cei cu abonament plătit.
Lansarea a generat un val de entuziasm, mai ales după ce modelul a devenit viral pe rețelele sociale datorită performanțelor sale impresionante.
Modelul este integrat direct în aplicația Gemini. O poți accesa online și poți începe să generezi sau să editezi imagini pur și simplu folosind comenzi text, ca și cum ai vorbi cu un asistent AI.
Acest model este de asemenea disponibil și pentru dezvoltatori și companii, prin intermediul Gemini API, Google AI Studio și Vertex AI.
O Lansare Misterioasă care a Cucerit Internetul
În ultimele săptămâni, un model AI anonim, denumit „Nano-Banana”, a atras atenția comunității online pe platforme precum LMArena, unde a fost testat în mod „orb” împotriva altor modele de inteligență artificială.
Utilizatorii au fost impresionați de capacitatea sa de a păstra consistența personajelor și scenelor, chiar și în cazul editărilor complexe.
Speculațiile au indicat rapid spre Google ca fiind creatorul acestui instrument, ipoteză confirmată pe 26 august 2025, când compania a anunțat integrarea acestuia în ecosistemul Gemini.
„Oamenii au fost înnebuniți după el încă din faza de previzualizare,” a declarat Google într-un comunicat oficial, făcând referire la entuziasmul generat de „Nano-Banana”.
Modelul, dezvoltat de divizia DeepMind a Google, este acum disponibil în aplicația Gemini, prin Gemini API, Google AI Studio și Vertex AI, oferind atât utilizatorilor individuali, cât și dezvoltatorilor acces la funcționalități de top.
Ce Face Gemini 2.5 Flash Image Special?
Gemini 2.5 Flash Image se remarcă prin capacitatea sa de a edita și genera imagini cu un nivel ridicat de precizie și consistență.
Spre deosebire de alte modele de generare AI, care pot întâmpina dificultăți în păstrarea detaliilor în editări succesive, acest model excelează în menținerea identității subiecților – fie că este vorba de persoane, animale de companie sau obiecte.
Google oferă exemple concrete: de la aplicarea unei coafuri retro anilor ’60 pe o fotografie personală, la adăugarea unui tutu pe un chihuahua, păstrând în același timp aspectul natural al imaginii.
Printre funcționalitățile cheie se numără:
-
-
- Combină fotografii: Acum poți încărca mai multe fotografii și le poți combina pentru a crea o scenă complet nouă. De exemplu, poți lua fotografia ta și o alta a câinelui tău pentru a crea un portret perfect cu voi doi pe terenul de baschet.
- Combină fotografii: Acum poți încărca mai multe fotografii și le poți combina pentru a crea o scenă complet nouă. De exemplu, poți lua fotografia ta și o alta a câinelui tău pentru a crea un portret perfect cu voi doi pe terenul de baschet.
-
-
-
- Editare multi-turn: Utilizatorii pot efectua modificări succesive asupra unei imagini, păstrând consistența scenei. De exemplu, pot schimba culoarea pereților unei camere, apoi adăuga o bibliotecă și un covor, fără ca imaginea să-și piardă coerența.
-
-
-
- Generare bazată pe stiluri: Modelul poate prelua elemente de design, cum ar fi textura și culoarea petalelor unei flori, și le poate aplica pe alte obiecte, precum o pereche de cizme.
-
-
-
- Integrare multimodală: Gemini 2.5 Flash Image combină înțelegerea textului și a imaginilor pentru a genera rezultate realiste, bazate pe descrieri detaliate sau combinații de imagini.
-
Google subliniază că imaginile generate sau editate includ un watermark vizibil „AI” și un watermark digital invizibil SynthID, pentru a preveni utilizarea abuzivă și pentru a indica originea AI a conținutului.
Impactul și Potențialul în Diverse Industrii
Lansarea Gemini 2.5 Flash Image are implicații majore pentru industrii variate. Echipele de marketing pot crea campanii vizuale în câteva ore, în loc de zile, datorită capacității modelului de a genera și edita imagini rapid.
În comerțul electronic, platformele au raportat o creștere a conversiilor cu 34% prin utilizarea acestui instrument pentru a genera variante de culori și stiluri ale produselor, reducând costurile de fotografie.
Studiourile de jocuri folosesc deja modelul pentru a crea portrete detaliate pentru personaje non-jucătoare (NPC-uri).
„Acest lucru nu este doar despre generarea de imagini, ci despre editare, conservare și stilizare conform indicațiilor umane,” notează un articol din Medium. „Nu este doar un instrument pentru joacă – ar putea sfida aplicații precum Photoshop sau Canva pe termen lung.”
Provocări și Responsabilitate
Deși Gemini 2.5 Flash Image impresionează prin performanțe, Google recunoaște riscurile asociate cu astfel de tehnologii.
Editarea avansată a imaginilor poate fi folosită în scopuri rău-intenționate, cum ar fi crearea de deepfake-uri. Pentru a contracara acest risc, Google a implementat politici stricte, interzicând generarea de imagini intime non-consensuale și aplicând watermark-uri pentru a asigura trasabilitatea conținutului generat.
În plus, funcționalitatea nu este disponibilă pentru conturile de muncă sau educaționale din anumite regiuni, precum Zona Economică Europeană, Elveția sau Regatul Unit, din cauza reglementărilor locale.
Disponibilitate și Perspective
Gemini 2.5 Flash Image este disponibil gratuit pentru utilizatorii Gemini, cu o limită de 100 de editări pe zi, în timp ce abonații plătiti beneficiază de până la 1.000 de editări zilnic.
Dezvoltatorii pot accesa modelul prin Google AI Studio și Vertex AI, permițând integrarea în aplicații personalizate.
Google planifică extinderea funcționalităților, inclusiv integrarea în alte produse și posibile lansări sub umbrela Imagen, modelul specializat de generare de imagini al companiei.
Cu Gemini 2.5 Flash Image, Google nu doar că răspunde concurenței din partea altor giganți AI, precum OpenAI, XAI, Midjourney, dar face şi un pas înainte, mai ales prin editarea cu menținerea consistentǎ a elementelor din imagini.
Surse: blog.google


