구글 딥마인드, 3D 가상 세계에서 놀고, 추론하고, 학습할 수 있는 AI 에이전트 SIMA 2 공개
요컨대
Google DeepMind는 가상 환경에서 지시를 이해하고, 추론하고, 스스로 새로운 기술을 배울 수 있는 SIMA 2 AI 에이전트를 출시하여 인간 수준의 작업 완료에 근접했습니다.
기술 회사 Google의 AI 부문 Google DeepMind SIMA 2는 Scalable Instructable Multiworld Agent의 최신 버전이며, 더욱 유능하고 일반적인 용도의 AI 에이전트로의 전환을 의미합니다.
제미니 모델의 고급 추론 기능을 기반으로 구축된 이 시스템은 가상 환경에서 기본적인 지시를 따르는 수준을 넘어, 목표를 해석하고, 사용자와 대화하고, 시간이 지남에 따라 성능을 개선할 수 있는 대화형 동반자 역할을 합니다.
최초의 SIMA 모델은 통합된 게임 메커니즘 대신 화면 입력을 관찰하고 가상 컨트롤을 사용하여 상업용 비디오 게임에서 수백 가지의 언어 기반 동작을 학습했습니다.
SIMA 2는 Gemini를 핵심으로 내장하여 이러한 접근 방식을 더욱 발전시켜, 에이전트가 목표 지향적 추론을 수행하고, 의도된 행동을 설명하며, 게임 내에서 더욱 복잡한 작업을 수행할 수 있도록 합니다. 인간의 시연과 Gemini에서 생성된 주석을 결합하여 학습된 이 에이전트는 여러 개발자와의 파트너십을 통해 더욱 광범위한 게임에서 테스트되었습니다. 이번 업데이트는 역동적인 3D 환경에서 지각, 추론, 그리고 행동을 결합하는 체화 AI의 중요한 진전을 의미합니다.
Gemini 통합을 통해 SIMA 2는 낯선 환경에서도 일반화하고 안정적으로 작동하는 능력을 강화했습니다. 이제 에이전트는 더욱 상세하고 섬세한 명령을 해석하고, 이전에 접하지 못했던 게임, 예를 들어 바이킹 테마의 게임 ASKA나 마인크래프트의 연구 버전인 MineDojo에서도 성공적으로 실행할 수 있습니다.
학습한 개념을 다양한 환경에 적용할 수 있는 능력(예를 들어, 한 게임에서 '채굴'이라는 개념을 확장하여 다른 게임에서 '수확'이라는 개념을 구현하는 것)은 광범위한 일반화의 핵심 구성 요소를 형성하며, 게임의 성능을 인간 플레이어의 성능에 더 가깝게 만듭니다.
이러한 기능을 평가하기 위해, SIMA 2는 Genie 3에서 생성된 절차적으로 생성된 3D 세계에서도 테스트되었습니다. Genie 3는 텍스트 또는 이미지 프롬프트를 통해 새로운 환경을 생성합니다. 이러한 낯선 환경에서도 에이전트는 효과적으로 탐색하고, 지시를 해석하고, 사용자 중심적인 방향으로 나아갈 수 있었습니다.defi달성된 목표는 이전에 유사한 시스템에서는 관찰되지 않았던 수준의 적응성을 보여줍니다.
SIMA 2는 일반화 및 자율 학습의 새로운 기능으로 자체 개선 AI를 발전시킵니다.
이에 따르면 회사SIMA 2의 가장 주목할 만한 발전 중 하나는 스스로 성능을 향상시키는 새로운 능력입니다. 훈련 과정에서 에이전트는 반복적인 시행착오와 Gemini의 피드백을 결합하여 점점 더 복잡한 작업을 수행할 수 있음을 보여주었습니다. 인간의 시연을 통해 학습한 후, SIMA 2는 추가적인 인간 데이터 없이도 익숙하지 않은 환경에서 기술을 습득하며 자율 플레이를 통해 새로운 게임에서 계속해서 발전할 수 있습니다. 이러한 경험은 이후 더욱 강력한 후속 버전의 에이전트를 훈련하는 데 활용될 수 있습니다. AI 에이전트그리고 동일한 자기 계발 프로세스가 Genie가 생성한 환경에서도 성공적으로 적용되어, 다양한 합성 세계에서 일반 에이전트를 훈련하는 데 있어 의미 있는 진전을 이루었습니다. 이러한 지속적인 개선 주기는 에이전트가 최소한의 인간 지도로 학습할 수 있도록 하는 장기적인 목표를 뒷받침합니다.
SIMA 2는 광범위한 게임 환경에서 작동하며, 일반 지능을 위한 중요한 시험대를 제공하여 기술을 습득하고, 추론을 연습하고, 자기 주도적 행동을 통해 지속적으로 학습할 수 있도록 합니다. 이 시스템은 일반적이고 상호작용적이며 체화된 지능을 향한 상당한 진전을 보여주지만, 연구 단계의 한계를 여전히 안고 있습니다. 에이전트는 확장된 추론이나 반복적인 목표 검증을 요구하는 복잡하고 장기적인 과제를 수행하는 데 여전히 어려움을 겪고 있으며, 제한된 맥락 내에서 저지연 상호작용이 필요하기 때문에 메모리가 부족합니다. 세밀한 동작의 정확성과 복잡한 3D 장면의 시각적 이해 또한 이 분야 전반에 걸쳐 더욱 중요한 과제로 남아 있습니다.
이 프로젝트는 다양한 훈련 데이터와 강력한 추론 능력을 바탕으로 광범위한 역량을 뒷받침하는 행동 지향적 AI 접근법의 잠재력을 보여줍니다. SIMA 2는 이러한 요소들이 별도의 전문 시스템에 분리되어 있지 않고 단일 범용 에이전트로 통합될 수 있음을 보여주며, 가상 환경에서 학습된 내비게이션, 도구 사용, 협업 작업 처리와 같은 많은 기술들이 구현된 AI의 기본 구성 요소로 변환됨에 따라 로봇 공학 분야의 미래 응용 분야로 나아가는 유망한 길을 제시합니다.
SIMA 2는 상호작용적이고 인간 중심적인 연구 에이전트로 설계되었으며, 개발 과정에서 책임 있는 관행, 특히 자기 개선 메커니즘에 중점을 두고 있습니다. 연구팀은 프로젝트 전반에 걸쳐 책임 있는 혁신 전문가들과 협력하여 SIMA 2를 제한된 연구 미리보기 형태로 출시하여 선정된 학계 및 게임 개발자에게 조기 접근 권한을 제공하고 있습니다. 이러한 단계적 접근 방식을 통해 기술과 그 잠재적 함의를 더욱 심도 있게 탐구하면서 지속적인 검토, 피드백, 그리고 학제 간 평가가 가능합니다.
책임 한계
줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.
저자에 관하여
전담 저널리스트인 알리사(Alisa) MPost, 암호화폐, 영지식 증명, 투자 및 광범위한 영역을 전문으로 합니다. Web3. 새로운 트렌드와 기술에 대한 예리한 안목을 바탕으로 그녀는 끊임없이 진화하는 디지털 금융 환경에 대해 독자들에게 정보를 제공하고 참여시키기 위해 포괄적인 취재를 제공합니다.
더 많은 기사
전담 저널리스트인 알리사(Alisa) MPost, 암호화폐, 영지식 증명, 투자 및 광범위한 영역을 전문으로 합니다. Web3. 새로운 트렌드와 기술에 대한 예리한 안목을 바탕으로 그녀는 끊임없이 진화하는 디지털 금융 환경에 대해 독자들에게 정보를 제공하고 참여시키기 위해 포괄적인 취재를 제공합니다.