Google lansează Gemma 4, cel mai puternic LLM open source pentru device-uri comune

Google DeepMind a anunțat joi, 2 aprilie 2026, lansarea Gemma 4, cea mai capabilă familie de modele open-weight dezvoltată până acum de companie.

Modelele sunt construite pe baza cercetărilor care au stat la baza Gemini 3 și sunt optimizate pentru rularea pe hardware local, de la dispozitive edge până la stații de lucru, cu suport nativ pentru raționament avansat, fluxuri agentice și procesare multimodală offline.

Variantele familiei Gemma 4

Familia include patru variante, concepute pentru scenarii diferite de utilizare:

E2B (aprox. 2,3 miliarde parametri efectivi, 5,1 miliarde total cu embeddings) și E4B (4,5 miliarde efectivi, 8 miliarde total) – optimizate pentru dispozitive mobile și edge, cu suport audio nativ;
26B A4B – arhitectură Mixture-of-Experts (25,2 miliarde parametri totali, doar 3,8 miliarde activi);
31B – model dens cu 30,7 miliarde parametri.

Toate variantele oferă ferestre de context de până la 256.000 de tokeni (128.000 pentru modelele edge), suport multimodal (text + imagine pentru toate, audio și procesare video pe cadre pentru modelele mici), apelare nativă de funcții pentru agenți autonomi și funcționalitate de raționament pas-cu-pas („thinking mode”). Modelele au fost antrenate pe peste 140 de limbi și permit generare de cod de înaltă calitate fără conexiune la internet.

Performanțe pe benchmark-uri

Pe planul performanțelor, varianta 31B ocupă locul al treilea în clasamentul open models pe Arena AI (scor estimat 1.452), iar 26B A4B se clasează pe locul al șaselea (1.441), depășind modele cu parametri de până la 20 de ori mai mulți în anumite teste.

Comparativ cu Gemma 3 (27B), progresele sunt semnificative: AIME 2026 urcă de la 20,8% la 89,2% (31B), LiveCodeBench de la 29,1% la 80%, iar Codeforces ELO de la 110 la 2.150. Modelele excelează și la sarcini multimodale, cum ar fi MMMU Pro (76,9% pentru 31B) și înțelegerea documentelor sau graficelor.

Licență Apache 2.0 complet permisivă

O noutate importantă este licența: spre deosebire de versiunile anterioare, care aveau restricții comerciale și limitări privind distilarea, Gemma 4 este lansată sub licența Apache 2.0 complet permisivă.

Aceasta permite utilizare comercială liberă, fine-tuning, redistribuire și deploy pe infrastructuri suverane, inclusiv Google Cloud, fără restricții suplimentare.

Disponibilitate imediată

Modelele sunt disponibile imediat pentru descărcare și testare pe Google AI Studio, Hugging Face, Kaggle și Ollama. Pe partea edge, Gemma 4 se integrează cu instrumentele Google AI Edge, inclusiv aplicația Gallery pentru iOS și Android, unde dezvoltatorii pot construi agenți autonomi care rulează integral pe dispozitiv (exemple: planificare multi-pas, generare de conținut interactiv sau procesare audio-vizuală).

Performanța pe hardware limitat include peste 3.700 de tokeni prefill pe secundă pe NPU Qualcomm și rularea pe Raspberry Pi 5.

Impactul lansării

Lansarea răspunde direct feedback-ului dezvoltatorilor privind nevoia de licențe deschise și capabilități locale, reducând dependența de API-uri cloud pentru cazuri sensibile la confidențialitate sau offline.

Google subliniază că Gemma 4 extinde accesul la inteligență frontier la orice hardware, de la telefoane la servere on-premise.

Detalii complete, inclusiv cardul de model cu toate benchmark-urile, sunt disponibile pe site-ul oficial Google AI for Developers.

Dezvoltatorii pot începe experimentele direct în Google AI Studio sau prin descărcarea greutăților de pe Hugging Face.

Google lansează Gemma 4, cel mai puternic LLM open source pentru device-uri comune

Variantele familiei Gemma 4

Performanțe pe benchmark-uri

Licență Apache 2.0 complet permisivă

Disponibilitate imediată

Impactul lansării

Te-AI pregătit pentru ce vine?
Abonează-te la "Pulsul AI", newsletter-ul care te ține la zi cu noutățile din Inteligența Artificială. Fără hype sau panică. Doar ce contează.

Ultimele Știri

Angajatori de TOP, 26-27 martie – ia pulsul joburilor tech în era AI-ului

4 din 5 români susțin digitalizarea relației cu statul, dar consideră ritmul actual prea lent – studiu Edge Institute

De ce portofelul digital e un altfel de animal – eveniment Edge Institute

Noutăți din AI

Agenții au acum față și voce – Pika Labs lansează skill-ul video chat în timp real pentru agenți

Nebunia OpenClaw: Giganții din China lansează pe bandă rulantă versiuni proprii

Google Stitch: un nou tool AI care transformă descrierile în interfețe de aplicații

Anthropic lansează Claude Partner Network cu o investiție de 100 milioane dolari în 2026

Cognee: knowledge engine open-source pentru îmbunătățirea memoriei agenților AI

Google anunță un upgrade la modulul Deep Think din Gemini 3 pentru conversia schițelor în fișiere STL 3D-printabile

OpenAI angajează creatorul OpenClaw. “Lobsterul” rămâne open source

OpenClaw: prima criză majoră de securitate a agenților AI

Google lansează Gemma 4, cel mai puternic LLM open source pentru device-uri comune

Variantele familiei Gemma 4

Performanțe pe benchmark-uri

Licență Apache 2.0 complet permisivă

Disponibilitate imediată

Impactul lansării

Te-AI pregătit pentru ce vine? Abonează-te la "Pulsul AI", newsletter-ul care te ține la zi cu noutățile din Inteligența Artificială. Fără hype sau panică. Doar ce contează.

Ultimele Știri

Noutăți din AI

Te-AI pregătit pentru ce vine?
Abonează-te la "Pulsul AI", newsletter-ul care te ține la zi cu noutățile din Inteligența Artificială. Fără hype sau panică. Doar ce contează.