Google DeepMind afslører SIMA 2: AI-agent, der er i stand til at spille, ræsonnere og lære i virtuelle 3D-verdener
Kort sagt
Google DeepMind introducerede SIMA 2 AI-agenten, der kan forstå instruktioner, ræsonnere og lære sig selv nye færdigheder i virtuelle miljøer og dermed nærme sig opgaveafslutning på menneskeligt niveau.
AI-afdelingen af teknologivirksomheden Google, Google DeepMind introducerede SIMA 2, den seneste version af sin Scalable Instructable Multiworld Agent, der markerer et skridt mod mere kapable og almene AI-agenter.
Systemet, der er bygget på Gemini-modellernes avancerede ræsonnementsfunktioner, udvider sig ud over grundlæggende instruktioner i virtuelle miljøer og fungerer nu som en interaktiv ledsager, der kan fortolke mål, tale med brugere og forbedre sin ydeevne over tid.
Den første SIMA-model lærte hundredvis af sprogdrevne handlinger på tværs af kommercielle videospil ved at observere skærminput og betjene dem med virtuelle kontroller i stedet for integrerede spilmekanikker.
SIMA 2 videreudvikler denne tilgang ved at integrere Gemini som sin kerne, hvilket gør det muligt for agenten at udføre målrettet ræsonnement, forklare sine tilsigtede handlinger og udføre mere komplekse opgaver i spil. Agenten er trænet i en kombination af menneskelige demonstrationer og Gemini-genererede annotationer og er blevet testet på tværs af et bredere sæt af spil gennem partnerskaber med flere udviklere. Denne opdatering repræsenterer et vigtigt skridt for kropsliggjort AI, der kombinerer opfattelse, ræsonnement og handling i dynamiske 3D-miljøer.
Integrationen af Gemini har styrket SIMA 2's evne til at generalisere og fungere pålideligt på tværs af ukendte kontekster. Agenten kan nu fortolke mere detaljerede og nuancerede instruktioner og udføre dem med succes, selv i spil, den ikke tidligere har stødt på, såsom den vikingetema-title ASKA eller MineDojo, en forskningsversion af Minecraft.
Dens evne til at anvende lærte koncepter på tværs af forskellige miljøer – for eksempel at udvide ideen om "minedrift" fra ét spil til "høstning" i et andet – danner en nøglekomponent i bred generalisering og bringer dens ydeevne tættere på en menneskelig spillers.
For at evaluere disse funktioner blev SIMA 2 også testet i procedurelt genererede 3D-verdener skabt af Genie 3, som producerer nye miljøer ud fra tekst- eller billedprompter. I disse uvante omgivelser var agenten stadig i stand til at navigere effektivt, fortolke instruktioner og arbejde hen imod bruger-defined mål, hvilket viser et niveau af tilpasningsevne, der ikke tidligere er observeret i lignende systemer.
SIMA 2 fremmer selvforbedrende AI med nye muligheder inden for generalisering og autonom læring
Ifølge selskab, en af SIMA 2's mest bemærkelsesværdige udviklinger er dens nye evne til at forbedre sin egen ydeevne. Under træning har agenten demonstreret, at den kan påtage sig stadig mere komplekse opgaver gennem iterativ trial-and-error kombineret med feedback fra Gemini. Efter først at have lært fra menneskelige demonstrationer, er SIMA 2 i stand til at fortsætte med at udvikle sig i nye spil gennem autonomt spil og tilegne sig færdigheder i ukendte miljøer uden at kræve yderligere menneskelige data. Denne erfaring kan derefter bruges til at træne efterfølgende, mere kapable versioner af AI agent, og den samme selvforbedringsproces er blevet anvendt med succes i Genie-genererede miljøer, hvilket markerer et meningsfuldt fremskridt i retning af træning af generelle agenter på tværs af forskellige, syntetiske verdener. Denne cyklus af kontinuerlig forfining understøtter det langsigtede mål om at sætte agenter i stand til at lære med minimal menneskelig vejledning.
SIMA 2's drift på tværs af en bred vifte af spilmiljøer giver et vigtigt testområde for generel intelligens, der giver det mulighed for at tilegne sig færdigheder, øve ræsonnement og lære kontinuerligt gennem selvstyret handling. Selvom systemet repræsenterer et væsentligt skridt mod generalistisk, interaktiv, kropsliggjort intelligens, har det stadig klare begrænsninger på forskningsstadiet. Agenten kæmper fortsat med komplekse opgaver med lang horisont, der kræver udvidet ræsonnement eller gentagen målverifikation, og dens hukommelse forbliver kort på grund af behovet for interaktion med lav latenstid inden for et begrænset kontekstvindue. Præcision i finkornede handlinger og visuel forståelse af komplekse 3D-scener er også fortsat en bredere udfordring på tværs af feltet.
Projektet demonstrerer potentialet i en handlingsorienteret AI-tilgang, hvor bred kompetence understøttes af forskellige træningsdata og stærke ræsonnementsevner. SIMA 2 viser, at disse elementer kan forenes i en enkelt generalist snarere end isoleres i separate specialiserede systemer, og det giver en lovende vej mod fremtidige anvendelser inden for robotteknologi, da mange af de færdigheder, der læres i virtuelle omgivelser - såsom navigation, værktøjsbrug og samarbejdsbaseret opgavehåndtering - omsættes til grundlæggende komponenter for kropsliggjort AI.
SIMA 2 er designet som et interaktivt, menneskecentreret forskningsinstrument, og dets udvikling inkluderer et klart fokus på ansvarlig praksis, især hvad angår dets selvforbedringsmekanismer. Teamet har samarbejdet med specialister i ansvarlig innovation gennem hele projektet og udgiver SIMA 2 i en begrænset forskningsforhåndsvisning, der giver tidlig adgang til udvalgte akademikere og spiludviklere. Denne fasede tilgang giver mulighed for løbende granskning, feedback og tværfaglig evaluering, efterhånden som teknologien og dens potentielle implikationer udforskes yderligere.
Ansvarsfraskrivelse
I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.
Om forfatteren
Alisa, en dedikeret journalist ved MPost, har specialiseret sig i kryptovaluta, beviser uden viden, investeringer og den ekspansive verden af Web3. Med et skarpt øje for nye trends og teknologier leverer hun omfattende dækning for at informere og engagere læserne i det stadigt udviklende landskab af digital finans.
Flere artikler
Alisa, en dedikeret journalist ved MPost, har specialiseret sig i kryptovaluta, beviser uden viden, investeringer og den ekspansive verden af Web3. Med et skarpt øje for nye trends og teknologier leverer hun omfattende dækning for at informere og engagere læserne i det stadigt udviklende landskab af digital finans.