Inteligența artificială (IA) a evoluat semnificativ în ultimii ani, iar unul dintre cele mai recente progrese vine de la Google DeepMind. Această inovație își propune să redefinească modul în care înțelegem și interacționăm cu lumea virtuală, deschizând calea către aplicații IA mult mai generale și adaptabile. Un model de inteligență artificială dezvoltat de Google DeepMind poate acum să joace nouă jocuri video open-world, cum ar fi “No Man’s Sky”, “Teardown” și “Goat Simulator 3”, doar urmărind videoclipuri de pe ecran și controlând un tastatură și mouse, exact ca un om.
Progresele IA în Domeniul Jocurilor Video
Jocurile video au fost întotdeauna un teren de testare ideal pentru sistemele de inteligență artificială. De la maestrul virtual al șahului până la Go, jocurile cu reguli clare și obiective bine definite au oferit IA oportunitatea de a învăța și de a se dezvolta. Cu toate acestea, jocurile open-world, precum “Minecraft”, prezintă provocări suplimentare datorită obiectivelor lor abstracte și a informațiilor extranee care pot fi ignorate. Aceste jocuri oferă o gamă largă de alegeri și se aseamănă mai mult cu viața reală, ceea ce le face etape importante în antrenarea agenților IA pentru aplicații în lumea reală, cum ar fi controlul roboților și inteligența artificială generală.
SIMA: Agentul Multi-Lume Instruibil și Scalabil
Cercetătorii de la Google DeepMind au dezvoltat un agent IA denumit SIMA (Scalable Instructable Multiworld Agent), capabil să joace nouă jocuri video și medii virtuale nevăzute anterior, folosind doar fluxul video din joc. Aceasta include explorarea spațiului în “No Man’s Sky”, soluționarea problemelor în “Teardown” și acțiunea frenetică din “Goat Simulator 3”.
SIMA poate executa aproximativ 600 de sarcini, de 10 secunde sau mai puțin, care sunt comune în diferite jocuri, cum ar fi deplasarea, utilizarea obiectelor și navigarea în meniuri. Poate efectua, de asemenea, sarcini mai unice, cum ar fi zborul cu nave spațiale sau extracția de resurse.
Antrenamentul și Performanța SIMA
Pentru a antrena SIMA, cercetătorii au utilizat modele pre-existente de recunoaștere video și de imagine pentru a interpreta datele video ale jocului, apoi l-au antrenat pe SIMA să coreleze ce se întâmplă în video cu anumite sarcini. Aceasta a inclus colaborarea între perechi de persoane care jucau jocuri video împreună, una urmărind ecranul și indicând celeilalte ce mișcări să facă, precum și observarea retroactivă a propriilor acțiuni de joc pentru a descrie mișcările cu mouse-ul și tastatura. Aceasta a permis SIMA să învețe cum descrierile mișcărilor oamenilor se raportează la sarcinile în sine.
Antrenat pe opt jocuri, SIMA a putut apoi să joace un al nouălea joc pe care nu îl văzuse înainte. Cu toate acestea, performanța sa nu a atins încă nivelul uman. Metoda de antrenament a inclus rotația celor opt jocuri pe care IA a fost antrenată, astfel încât utilizarea celui de-al nouălea joc să servească drept test, asigurând capacitatea de a juca oricare dintre jocurile nevăzute anterior.
Implicații și Perspective
Extinderea capacităților SIMA peste diferite jocuri marchează un pas important către dezvoltarea unui agent IA generalist. Totuși, în prezent, SIMA poate efectua doar un set relativ limitat de sarcini scurte care nu necesită planificare pe termen lung. Abordarea unei game mult mai largi de sarcini complexe rămâne o provocare.
Este important de reținut că pentru companii precum DeepMind, cercetarea nu se limitează doar la jocuri; este despre robotică și despre crearea de sisteme IA care pot percepe și acționa în lumea reală. Astfel, în timp ce impactul direct asupra jocurilor video poate fi limitat, implicațiile pe termen lung asupra vieții noastre cotidiene rămân vaste și încă necunoscute.
Prin abordarea provocărilor prezentate de jocurile video open-world, Google DeepMind nu doar că împinge granițele a ceea ce poate realiza inteligența artificială, dar deschide și ușa către aplicații viitoare care ar putea schimba fundamental modul în care interacționăm cu tehnologia și lumea înconjurătoare.
Sursa: https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments/
Întrebări Frecvente Despre Proiectul Google DeepMind SIMA
Ce este SIMA?
SIMA (Scalable Instructable Multiworld Agent) este un agent de inteligență artificială dezvoltat de Google DeepMind, capabil să joace o varietate de jocuri video open-world doar urmărind videoclipuri de pe ecran și controlând o tastatură și un mouse, într-un mod similar cu comportamentul uman.
Cum învață SIMA să joace jocuri?
SIMA învață prin observarea și interpretarea datelor video din jocuri, folosind modele pre-existente de recunoaștere video și de imagine. Antrenamentul include colaborarea între jucători umani și revizuirea acțiunilor de joc, permițând SIMA să coreleze descrierile mișcărilor umane cu sarcinile specifice din joc.
Ce tipuri de jocuri poate juca SIMA?
SIMA este capabil să joace nouă jocuri video diferite și medii virtuale, inclusiv “No Man’s Sky”, “Teardown”, și “Goat Simulator 3”. Aceste jocuri variază de la explorarea spațiului la soluționarea problemelor și acțiune.
Ce sarcini poate efectua SIMA?
SIMA poate executa aproximativ 600 de sarcini de scurtă durată, cum ar fi deplasarea, utilizarea obiectelor și navigarea în meniuri. Poate efectua, de asemenea, sarcini mai complexe și unice pentru fiecare joc, cum ar fi zborul cu nave spațiale sau mineritul pentru resurse.
Cum se compară performanța SIMA cu cea a jucătorilor umani?
Deși SIMA a arătat capacitatea de a învăța și de a juca jocuri pe care nu le-a văzut anterior, performanța sa nu a atins încă nivelul uman. Capacitatea sa de a executa sarcini este încă limitată la acțiuni de scurtă durată care nu necesită planificare pe termen lung.
Ce înseamnă acest proiect pentru viitorul inteligenței artificiale?
Proiectul SIMA indică progrese semnificative în dezvoltarea inteligenței artificiale care poate învăța și acționa în medii complexe, variabile. Este un pas important către crearea de AI generalist, capabil să efectueze o gamă largă de sarcini și să funcționeze în scenarii din lumea reală, deschizând posibilități noi pentru robotică și alte aplicații.
English Article:
Google DeepMind has made a significant leap forward in artificial intelligence with its development of an AI that can play open-world video games by simply watching them. This AI, named the Scalable Instructable Multiworld Agent (SIMA), can control a keyboard and mouse to play nine different video games it has never seen before, including titles like No Man’s Sky, Teardown, and Goat Simulator 3. This achievement marks a departure from traditional AI tasks focused on games with clear win-loss conditions, like chess or Go, venturing into the more complex and nuanced realm of open-world games.
Open-world games, known for their abstract objectives and the vast array of choices they present, pose a significant challenge for AI due to the requirement to ignore irrelevant information and focus on goal-oriented actions. These games more closely mimic the complexity of real-life scenarios, making them ideal testing grounds for developing AI that could eventually perform tasks in the physical world, such as robot control or achieving artificial general intelligence.
SIMA operates by watching game video feeds and interpreting these visuals to perform about 600 different tasks, ranging from basic navigation and object interaction to more specific actions like flying spaceships or mining. This capability is achieved through a combination of pre-existing video and image recognition models and a novel training approach where the AI learns from human players describing their in-game actions.
Despite its ability to adapt to new games it hasn’t encountered during training, SIMA’s performance has not yet reached human levels, especially in tasks requiring long-term planning. The researchers’ method involves training the AI on a set of eight games and then testing it on a ninth, unseen game to ensure generalizability.
The development of SIMA highlights the potential for AI to learn and operate in diverse, complex environments, moving beyond games to real-world applications. Experts emphasize that while the immediate impact on video gaming might be limited, the broader implications for robotics and AI in everyday life are significant. This research underscores the ongoing shift towards creating versatile, generally intelligent AI systems capable of understanding and interacting with the world in a human-like manner.