Google DeepMind lansează SIMA 2: Agentul AI care joacă, raționează și învață singur în lumi virtuale


Google DeepMind a prezentat SIMA 2 (Scalable Instructable Multiworld Agent 2), o versiune major îmbunătățită a agentului AI capabil să navigheze, să înțeleagă și să acționeze în medii 3D complexe.

Susținut de modelele Gemini, SIMA 2 nu se mai limitează la comenzi simple. Devine un partener activ: gândește strategic, explică raționamente, învață din greșeli și se adaptează la lumi noi – inclusiv cele generate dinamic de alte AI.

Ce este SIMA 2 și cum funcționează?

Spre deosebire de agenții clasici, SIMA 2 percepe mediul virtual „cu ochii” unui utilizator real: vizual, prin ecran, și interacționează cu tastatură și mouse virtuale. Nu are acces la codul jocului sau la API-uri. Învață exclusiv din imagini și comenzi în limbaj natural.

Comparativ cu SIMA 1 (lansat în martie 2024), capabil doar de comenzi simple, SIMA 2 poate:

  • Înțelege obiective complexe și de lungă durată (ex: „construiește o casă și apără-o”)
  • Raționa pas cu pas și explica intențiile sale
  • Accepta instrucțiuni multimodale: text, voce, imagini, emoji, limbi străine
  • Învăța singur prin trial-and-error, cu feedback de la Gemini, fără date umane adiționale
  • Transfera cunoștințe între jocuri (ex: aplică „minat” ca „recoltat” într-un alt joc)

Antrenamentul s-a bazat pe demonstrații umane cu etichete în limbaj natural, dar și pe etichete generate de Gemini – ceea ce permite descrierea acțiunilor și auto-îmbunătățirea continuă.

Performanțe impresionante în jocuri necunoscute

SIMA 2 a fost testat în peste 10 jocuri comerciale – printre care No Man’s Sky, Valheim, Satisfactory, Goat Simulator 3, Teardown – dar și în lumi generate de Genie 3, un model DeepMind specializat în crearea de medii virtuale.

Rezultatele sunt notabile:

  • Reduce semnificativ diferența față de performanța umană în sarcini complexe
  • Reușește în jocuri complet necunoscute anterior, unde SIMA 1 eșua
  • Navighează și atinge obiective în lumi generate în timp real de Genie 3

Exemple concrete din demonstrații

  • În No Man’s Sky: detectează o navă prăbușită, escaladează o stâncă, sare pe epavă
  • În Goat Simulator 3: explică cum poate ajunge la o roșie uriașă pe un pod
  • În Valheim: explorează noaptea, identifică un beacon și analizează obiecte luminoase

De ce contează asta?

Cercetătorii DeepMind consideră că SIMA 2 oferă o cale realistă către robotică și AGI (Inteligență Artificială Generală). Capacitățile de navigare în 3D, înțelegerea intențiilor umane și învățarea autonomă sunt esențiale pentru AI-ul care va funcționa și în lumea reală.

„SIMA 2 nu este doar un jucător mai bun – este un companion interactiv care îți explică gândurile și învață alături de tine”, spun autorii în blogul oficial DeepMind.

Ce urmează?

Echipa recunoaște provocările rămase: gestionarea sarcinilor de lungă durată, memoria limitată de context și precizia acțiunilor la nivel de pixel. Cu toate acestea, progresul este rapid.

SIMA 2 deja învață în buclă închisă, iar integrarea cu Genie permite antrenarea într-un flux infinit de lumi generate de AI. Momentan, SIMA 2 este disponibil doar în regim de preview pentru cercetători, dar demonstrațiile video indică o direcție clară: AI-ul care nu doar „joacă” jocuri, ci înțelege lumea, așa cum o facem și noi.

Resurse oficiale

Te-AI pregătit pentru ce vine?
Abonează-te la "Pulsul AI", newsletter-ul care te ține la zi cu noutățile din Inteligența Artificială. Fără hype sau panică. Doar ce contează.

Ultimele Știri

Noutăți din AI