Google Gemini 2.5 Pro: Detalii despre noul model AI

Pe 25 martie 2025, Google a lansat Gemini 2.5 Pro, cel mai mai avansat model al companiei din acest moment.

Versiunea, numită „experimentală” (Gemini 2.5 Pro Experimental), face parte din familia Gemini 2.5 și pune accent pe raționament, analizând problemele înainte de a oferi răspunsuri. Iată ce se știe despre el până la 30 martie 2025.

Caracteristici principale

Modelul e construit să proceseze informații și să tragă concluzii logice, incluzând contextul, ceea ce îl ajută în rezolvarea problemelor complexe, cu mai mulți pași. Google spune că această capacitate de raționament e integrată nativ în toate modelele Gemini 2.5. Poate lucra cu text, audio, imagini, video și cod, gestionând aceste tipuri de date fără conversii intermediare. Fereastra de context începe de la 1 milion de tokeni – cam 750.000 de cuvinte, cât „Stăpânul Inelelor” – și urmează să crească la 2 milioane. Spre comparație, OpenAI o3-mini are 200.000, iar DeepSeek R1, 128.000.

În programare, Google afirmă că Gemini 2.5 Pro face un salt față de Gemini 2.0, generând aplicații web, cod „agentic” și editând eficient. Poate crea, de exemplu, un joc funcțional pornind de la o linie de text.

Rezultate la teste

Gemini 2.5 Pro a obținut scoruri notabile în mai multe evaluări:

  • LMArena: Locul 1 cu 1443, peste Grok 3 (1404), cu un avantaj de 39 de puncte ELO, bazat pe preferințele utilizatorilor.
  • Humanity’s Last Exam: 18,8% fără unelte externe, mai bine decât OpenAI o3-mini (14%) și Claude 3.7 Sonnet (8,9%). Testul verifică raționamentul și cunoștințele generale.
  • Matematică și știință: 86,7% la AIME 2025 (matematică) și 84% la GPQA Diamond (științe), fără tehnici suplimentare costisitoare. Totuși, e sub DeepSeek R1 (93,3%) la AIME.
  • Programare: 63,8% la SWE-Bench Verified (cod agentic) și 68,6% la Aider Polyglot (editare cod), peste multe modele, dar sub Claude 3.7 Sonnet (70,3% la SWE-Bench).
  • Multimodalitate: 81,7% la MMMU, cu rezultate solide în raționament vizual și cross-modal.

Disponibilitate

Modelul e accesibil acum prin Google AI Studio, gratuit pentru dezvoltatori, și în aplicația Gemini pentru abonații Gemini Advanced (20 dolari/lună). Înlocuiește Gemini 2.0 Pro Experimental pe aceste platforme. Urmează să fie integrat în Vertex AI în săptămânile viitoare, dar prețurile pentru limite API mai mari nu sunt încă stabilite. Pe X, utilizatorii spun că Google ajustează deja limitele de acces și adaugă funcții precum codare live și integrare cu Colab, ca răspuns la feedback.

Context și reacții

Lansarea vine după Gemini 2.0 din decembrie 2024 și reflectă o direcție spre AI „agentic”, care înțelege contextul și rezolvă probleme complexe. Pe X, discuțiile notează performanța sa în teste și fereastra de context mare, comparându-l cu OpenAI o1 (septembrie 2024) sau DeepSeek R1. Totuși, lipsesc detalii complete despre unele teste multimodale, iar în programare e depășit de Claude în anumite scenarii.

Gemini 2.5 Pro continuă să fie experimental, ceea ce sugerează ajustări viitoare. Variante Flash ar putea apărea pentru cazuri unde eficiența contează mai mult.

Performanța sa îl plasează în competiție directă cu alte modele de top, dar impactul real va depinde de cum e folosit practic și de dezvoltările următoare. Detalii despre prețuri și integrarea completă în Vertex AI sunt așteptate în aprilie 2025.

Te-AI pregătit pentru ce vine?
Abonează-te la "Pulsul AI", newsletter-ul care te ține la zi cu noutățile din Inteligența Artificială. Fără hype sau panică. Doar ce contează.

Ultimele Știri

Noutăți din AI