Google DeepMind prezentuje SIMA 2: agenta AI zdolnego do zabawy, rozumowania i uczenia się w wirtualnych światach 3D
W skrócie
Google DeepMind przedstawił agenta sztucznej inteligencji SIMA 2, który potrafi rozumieć instrukcje, rozumować i uczyć się nowych umiejętności w środowiskach wirtualnych, zbliżając się do wykonywania zadań na poziomie człowieka.
Dział sztucznej inteligencji firmy technologicznej Google, Google DeepMind wprowadziła SIMA 2, najnowszą wersję swojego skalowalnego agenta Instructable Multiworld Agent, co stanowi krok w kierunku bardziej wydajnych i uniwersalnych agentów AI.
Zbudowany na zaawansowanych możliwościach rozumowania modeli Gemini, system wykracza poza podstawowe wykonywanie instrukcji w środowiskach wirtualnych i teraz działa jako interaktywny towarzysz, który potrafi interpretować cele, komunikować się z użytkownikami i udoskonalać swoje działanie w miarę upływu czasu.
Pierwszy model SIMA nauczył się setek działań sterowanych językiem w komercyjnych grach wideo, obserwując dane wejściowe z ekranu i obsługując wirtualne elementy sterujące, zamiast korzystać ze zintegrowanych mechanizmów gry.
SIMA 2 rozwija to podejście, osadzając Gemini jako rdzeń, umożliwiając agentowi rozumowanie ukierunkowane na cel, wyjaśnianie zamierzonych działań i wykonywanie bardziej złożonych zadań w grach. Agent, trenowany w oparciu o demonstracje prowadzone przez ludzi i adnotacje generowane przez Gemini, został przetestowany w szerszym zestawie gier we współpracy z wieloma deweloperami. Ta aktualizacja stanowi znaczący krok naprzód dla ucieleśnionej sztucznej inteligencji, łączącej percepcję, rozumowanie i działanie w dynamicznych środowiskach 3D.
Integracja Gemini wzmocniła zdolność SIMA 2 do generalizowania i niezawodnego działania w nieznanych kontekstach. Agent może teraz interpretować bardziej szczegółowe i zniuansowane instrukcje oraz wykonywać je pomyślnie nawet w grach, z którymi wcześniej się nie zetknął, takich jak ASKA, gra o tematyce wikingów, czy MineDojo, wersja badawcza Minecrafta.
Jej zdolność do stosowania nabytych koncepcji w różnych środowiskach — na przykład rozszerzenia idei „wydobywania” z jednej gry na „zbieranie” w innej — stanowi kluczowy element szerokiej generalizacji i sprawia, że jej działanie zbliża się do działania gracza-człowieka.
Aby ocenić te możliwości, SIMA 2 została również przetestowana w proceduralnie generowanych światach 3D stworzonych przez Genie 3, który tworzy nowe środowiska na podstawie komunikatów tekstowych lub graficznych. W tych nieznanych środowiskach agent nadal był w stanie skutecznie nawigować, interpretować instrukcje i pracować nad…defiwyznaczone cele, wykazując poziom adaptacji, jakiego wcześniej nie obserwowano w podobnych systemach.
SIMA 2 rozwija samodoskonalącą się sztuczną inteligencję dzięki nowym możliwościom w zakresie generalizacji i autonomicznego uczenia się
Według sukcesy firmaJednym z najważniejszych osiągnięć SIMA 2 jest rozwijająca się zdolność do samodoskonalenia. Podczas szkolenia agent wykazał, że potrafi wykonywać coraz bardziej złożone zadania, wykorzystując iteracyjne metody prób i błędów w połączeniu z informacjami zwrotnymi z Gemini. Po początkowym uczeniu się z demonstracji prowadzonych przez ludzi, SIMA 2 jest w stanie kontynuować postępy w nowych grach poprzez autonomiczną grę, zdobywając umiejętności w nieznanym środowisku bez konieczności korzystania z dodatkowych danych od człowieka. To doświadczenie można następnie wykorzystać do szkolenia kolejnych, bardziej zaawansowanych wersji. Agent AITen sam proces samodoskonalenia został z powodzeniem zastosowany w środowiskach generowanych przez Genie, co stanowi znaczący postęp w szkoleniu agentów ogólnych w zróżnicowanych, syntetycznych światach. Ten cykl ciągłego doskonalenia wspiera długoterminowy cel, jakim jest umożliwienie agentom uczenia się przy minimalnym wsparciu ze strony człowieka.
Działanie SIMA 2 w szerokim spektrum środowisk gier stanowi ważny poligon doświadczalny dla inteligencji ogólnej, umożliwiając jej nabywanie umiejętności, ćwiczenie rozumowania i ciągłą naukę poprzez samodzielne działania. Chociaż system stanowi znaczący krok w kierunku ogólnej, interaktywnej, ucieleśnionej inteligencji, nadal ma wyraźne ograniczenia na etapie badań. Agent nadal zmaga się ze złożonymi, długoterminowymi zadaniami, które wymagają rozszerzonego rozumowania lub wielokrotnej weryfikacji celu, a jego pamięć pozostaje krótka ze względu na konieczność interakcji o niskim opóźnieniu w ograniczonym oknie kontekstowym. Precyzja w precyzyjnych działaniach i wizualne rozumienie złożonych scen 3D również pozostają szerszym wyzwaniem w tej dziedzinie.
Projekt demonstruje potencjał podejścia opartego na sztucznej inteligencji (AI) zorientowanego na działanie, w którym szerokie kompetencje są wspierane przez zróżnicowane dane treningowe i silne zdolności wnioskowania. SIMA 2 pokazuje, że te elementy można zunifikować w jednym agencie generalistycznym, a nie izolowanym w oddzielnych, wyspecjalizowanych systemach, i stanowi obiecującą ścieżkę do przyszłych zastosowań w robotyce, ponieważ wiele umiejętności nabytych w środowiskach wirtualnych – takich jak nawigacja, korzystanie z narzędzi i wspólne wykonywanie zadań – przekłada się na fundamentalne komponenty ucieleśnionej AI.
SIMA 2 została zaprojektowana jako interaktywny, zorientowany na człowieka agent badawczy, a jej rozwój kładzie wyraźny nacisk na odpowiedzialne praktyki, szczególnie w odniesieniu do mechanizmów samodoskonalenia. Zespół współpracował ze specjalistami ds. odpowiedzialnej innowacji przez cały okres trwania projektu i udostępnia SIMA 2 w ograniczonej wersji zapoznawczej, zapewniając wczesny dostęp wybranym naukowcom i twórcom gier. To etapowe podejście pozwala na ciągłą kontrolę, zbieranie opinii i interdyscyplinarną ocenę w miarę dalszego zgłębiania technologii i jej potencjalnych implikacji.
Zastrzeżenie
Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.
O autorze
Alisa, oddana dziennikarka w MPost, specjalizuje się w kryptowalutach, dowodach wiedzy zerowej, inwestycjach i ekspansywnej dziedzinie Web3. Ze szczególnym uwzględnieniem pojawiających się trendów i technologii zapewnia wszechstronne informacje, aby informować czytelników i angażować ich w stale zmieniający się krajobraz finansów cyfrowych.
Więcej artykułów
Alisa, oddana dziennikarka w MPost, specjalizuje się w kryptowalutach, dowodach wiedzy zerowej, inwestycjach i ekspansywnej dziedzinie Web3. Ze szczególnym uwzględnieniem pojawiających się trendów i technologii zapewnia wszechstronne informacje, aby informować czytelników i angażować ich w stale zmieniający się krajobraz finansów cyfrowych.