Google DeepMind a prezentat SIMA 2 (Scalable Instructable Multiworld Agent 2), o versiune major îmbunătățită a agentului AI capabil să navigheze, să înțeleagă și să acționeze în medii 3D complexe.
Susținut de modelele Gemini, SIMA 2 nu se mai limitează la comenzi simple. Devine un partener activ: gândește strategic, explică raționamente, învață din greșeli și se adaptează la lumi noi – inclusiv cele generate dinamic de alte AI.
Ce este SIMA 2 și cum funcționează?
Spre deosebire de agenții clasici, SIMA 2 percepe mediul virtual „cu ochii” unui utilizator real: vizual, prin ecran, și interacționează cu tastatură și mouse virtuale. Nu are acces la codul jocului sau la API-uri. Învață exclusiv din imagini și comenzi în limbaj natural.
Comparativ cu SIMA 1 (lansat în martie 2024), capabil doar de comenzi simple, SIMA 2 poate:
- Înțelege obiective complexe și de lungă durată (ex: „construiește o casă și apără-o”)
- Raționa pas cu pas și explica intențiile sale
- Accepta instrucțiuni multimodale: text, voce, imagini, emoji, limbi străine
- Învăța singur prin trial-and-error, cu feedback de la Gemini, fără date umane adiționale
- Transfera cunoștințe între jocuri (ex: aplică „minat” ca „recoltat” într-un alt joc)
Antrenamentul s-a bazat pe demonstrații umane cu etichete în limbaj natural, dar și pe etichete generate de Gemini – ceea ce permite descrierea acțiunilor și auto-îmbunătățirea continuă.
Performanțe impresionante în jocuri necunoscute
SIMA 2 a fost testat în peste 10 jocuri comerciale – printre care No Man’s Sky, Valheim, Satisfactory, Goat Simulator 3, Teardown – dar și în lumi generate de Genie 3, un model DeepMind specializat în crearea de medii virtuale.
Rezultatele sunt notabile:
- Reduce semnificativ diferența față de performanța umană în sarcini complexe
- Reușește în jocuri complet necunoscute anterior, unde SIMA 1 eșua
- Navighează și atinge obiective în lumi generate în timp real de Genie 3
Exemple concrete din demonstrații
- În No Man’s Sky: detectează o navă prăbușită, escaladează o stâncă, sare pe epavă
- În Goat Simulator 3: explică cum poate ajunge la o roșie uriașă pe un pod
- În Valheim: explorează noaptea, identifică un beacon și analizează obiecte luminoase
De ce contează asta?
Cercetătorii DeepMind consideră că SIMA 2 oferă o cale realistă către robotică și AGI (Inteligență Artificială Generală). Capacitățile de navigare în 3D, înțelegerea intențiilor umane și învățarea autonomă sunt esențiale pentru AI-ul care va funcționa și în lumea reală.
„SIMA 2 nu este doar un jucător mai bun – este un companion interactiv care îți explică gândurile și învață alături de tine”, spun autorii în blogul oficial DeepMind.
Ce urmează?
Echipa recunoaște provocările rămase: gestionarea sarcinilor de lungă durată, memoria limitată de context și precizia acțiunilor la nivel de pixel. Cu toate acestea, progresul este rapid.
SIMA 2 deja învață în buclă închisă, iar integrarea cu Genie permite antrenarea într-un flux infinit de lumi generate de AI. Momentan, SIMA 2 este disponibil doar în regim de preview pentru cercetători, dar demonstrațiile video indică o direcție clară: AI-ul care nu doar „joacă” jocuri, ci înțelege lumea, așa cum o facem și noi.
Resurse oficiale
- Blogul oficial DeepMind: deepmind.google/blog/sima-2


