Google DeepMind a anunțat joi, 2 aprilie 2026, lansarea Gemma 4, cea mai capabilă familie de modele open-weight dezvoltată până acum de companie.
Modelele sunt construite pe baza cercetărilor care au stat la baza Gemini 3 și sunt optimizate pentru rularea pe hardware local, de la dispozitive edge până la stații de lucru, cu suport nativ pentru raționament avansat, fluxuri agentice și procesare multimodală offline.
Variantele familiei Gemma 4
Familia include patru variante, concepute pentru scenarii diferite de utilizare:
- E2B (aprox. 2,3 miliarde parametri efectivi, 5,1 miliarde total cu embeddings) și E4B (4,5 miliarde efectivi, 8 miliarde total) – optimizate pentru dispozitive mobile și edge, cu suport audio nativ;
- 26B A4B – arhitectură Mixture-of-Experts (25,2 miliarde parametri totali, doar 3,8 miliarde activi);
- 31B – model dens cu 30,7 miliarde parametri.
Toate variantele oferă ferestre de context de până la 256.000 de tokeni (128.000 pentru modelele edge), suport multimodal (text + imagine pentru toate, audio și procesare video pe cadre pentru modelele mici), apelare nativă de funcții pentru agenți autonomi și funcționalitate de raționament pas-cu-pas („thinking mode”). Modelele au fost antrenate pe peste 140 de limbi și permit generare de cod de înaltă calitate fără conexiune la internet.
Performanțe pe benchmark-uri
Pe planul performanțelor, varianta 31B ocupă locul al treilea în clasamentul open models pe Arena AI (scor estimat 1.452), iar 26B A4B se clasează pe locul al șaselea (1.441), depășind modele cu parametri de până la 20 de ori mai mulți în anumite teste.
Comparativ cu Gemma 3 (27B), progresele sunt semnificative: AIME 2026 urcă de la 20,8% la 89,2% (31B), LiveCodeBench de la 29,1% la 80%, iar Codeforces ELO de la 110 la 2.150. Modelele excelează și la sarcini multimodale, cum ar fi MMMU Pro (76,9% pentru 31B) și înțelegerea documentelor sau graficelor.
Licență Apache 2.0 complet permisivă
O noutate importantă este licența: spre deosebire de versiunile anterioare, care aveau restricții comerciale și limitări privind distilarea, Gemma 4 este lansată sub licența Apache 2.0 complet permisivă.
Aceasta permite utilizare comercială liberă, fine-tuning, redistribuire și deploy pe infrastructuri suverane, inclusiv Google Cloud, fără restricții suplimentare.
Disponibilitate imediată
Modelele sunt disponibile imediat pentru descărcare și testare pe Google AI Studio, Hugging Face, Kaggle și Ollama. Pe partea edge, Gemma 4 se integrează cu instrumentele Google AI Edge, inclusiv aplicația Gallery pentru iOS și Android, unde dezvoltatorii pot construi agenți autonomi care rulează integral pe dispozitiv (exemple: planificare multi-pas, generare de conținut interactiv sau procesare audio-vizuală).
Performanța pe hardware limitat include peste 3.700 de tokeni prefill pe secundă pe NPU Qualcomm și rularea pe Raspberry Pi 5.
Impactul lansării
Lansarea răspunde direct feedback-ului dezvoltatorilor privind nevoia de licențe deschise și capabilități locale, reducând dependența de API-uri cloud pentru cazuri sensibile la confidențialitate sau offline.
Google subliniază că Gemma 4 extinde accesul la inteligență frontier la orice hardware, de la telefoane la servere on-premise.
Detalii complete, inclusiv cardul de model cu toate benchmark-urile, sunt disponibile pe site-ul oficial Google AI for Developers.
Dezvoltatorii pot începe experimentele direct în Google AI Studio sau prin descărcarea greutăților de pe Hugging Face.


