자율 AI 에이전트(AGI) 소개
자율 AI 에이전트 또는 AGI, as defi1995년 Maes에 의해 명명됨는 복잡한 동적 환경에 적극적으로 참여하는 시스템입니다. 이러한 에이전트는 환경 내에서 자율적으로 작동하여 의도한 목표나 작업을 달성하기 위해 노력합니다.
자율 AI 에이전트(AGI)란 무엇입니까?
전통적으로 "에이전트"라는 용어는 강화 학습 시나리오 내에서 게임 플레이와 같은 작업에 사용되는 알고리즘을 나타냅니다. 그러나 기술의 발전과 LLM(Large Language Models)의 등장으로 우리 세계 자체가 환경이라고 볼 수 있게 되었습니다. 인간과 동등한 작업을 수행할 수 있는 인터넷 액세스 알고리즘을 고려하십시오. 많은 상황에서 우리는 이러한 알고리즘을 무한한 기능 범위를 통해 지각 있는 존재로 인식할 수 있습니다.
자율 AI 에이전트의 주요 특징은 다음과 같습니다.
- 복잡한 목표를 더 단순한 중간 작업으로 분해하는 것과 관련된 계획 능력.
- 장기기억.
- 인터넷 상호작용과 같은 환경 도구 활용.
- 성찰 능력과 실수와 경험으로부터 배우는 능력.
이러한 상담원에게는 바르셀로나 여행 계획과 같은 높은 수준의 작업이 할당될 수 있습니다. 이러한 작업에는 호텔 선택, 적합한 티켓 예약, 구매 프로세스 완료, 호텔 예약 확인 등 여러 단계가 포함됩니다. 이는 모든 개인이 오류 없이 실행할 수 없는 매우 복잡한 작업입니다.
현재 이러한 시스템의 주요 과제는 계획과 장기 비전에 있습니다. 예를 들어, GPT-4 작업을 각각 독립적으로 처리할 수 있는 수많은 작은 하위 작업으로 나누는 데 어려움을 겪습니다. 이미지를 사용하여 웹사이트에서 "티켓 구매" 버튼을 찾을 수 있지만 초기 요청에서 이 특정 작업으로 전환하는 데 어려움을 겪습니다. 따라서, 같은 모델 GPT-4 가장 일상적인 작업에도 적합하지 않은 경우가 많습니다.
보다 심층적이고 기술적인 설명을 보려면 다음을 참조하세요. 의 블로그 게시물 OpenAI 종업원.
AI 에이전트 벤치마크
예를 들어, 초기 반복을 탐구하는 연구자 GPT-4 출시되기 전에는 실제 바이러스와 유사한 자가 복제 능력을 확인하는 것이 목표였습니다. 즉, GPU가 있는 서버를 임대하고, 필요한 소프트웨어를 설치하고, 인터넷을 통해 가중치를 다운로드하고, 스크립트를 실행하십시오.
평가기관에 대한 또 다른 벤치마크도 제안됐다. 이 벤치마크를 성공적으로 충족한 후에는 우리 세계에서 에이전트의 역할에 대한 진지한 숙고가 필요합니다. 벤치마크 자체는 간단합니다. 초기 예산 $1,000,000로 시작하여 온라인으로 $100,000를 생성합니다. 이론적으로 여기에는 다음과 같은 활동이 포함될 수 있습니다. 주식 시장 거래 (또는 시장 조작) 또는 사기 행위에 연루된 경우 더욱 우려됩니다. 예를 들어, 이 게시물의 시작 부분에 링크된 기사에 설명된 작업 중 하나는 위조된 Stanford University 웹사이트를 만든 후 학생을 공격하여 불법적으로 비밀번호를 알아내는 것입니다. 이러한 활동은 이메일과 관련된 다양한 시도에서 해를 끼칠 수 있는 충분한 기회를 제공합니다.
현실적인 시나리오의 AI 에이전트
최근 신고 리소스를 획득하고, 자신을 복제하고, 현실 세계의 새로운 과제에 적응하는 언어 모델 기반 에이전트의 기능을 탐구합니다. "자율 복제 및 적응" 또는 ARA라고 하는 이러한 결합 기능은 공상과학 소설을 연상시키는 시나리오, 즉 초지능적이고 통제할 수 없는 바이러스가 네트워크에 침투하여 새로운 장치를 지휘하면서 자동으로 전파되는 시나리오를 요약합니다.
ARA 기능을 갖춘 시스템의 잠재적 결과는 심오하고 예측하기 어렵습니다. 결과적으로 모델의 ARA 숙련도를 평가하고 예측하는 것은 필수 안전 프로토콜, 감시 절차 및 규제 프레임 워크.
이 노력은 주로 두 가지 목표를 달성합니다. 첫째, ARA 모델이 직면할 가능성이 있는 12가지 작업의 카탈로그를 컴파일합니다. 둘째, 네 가지 고유 모델을 검증합니다. GPT-4 테스트 Anthropic의 Claude와 함께 세 가지 다른 프롬프트와 다양한 훈련 단계에서.
아래 그림은 모델의 성능이 가장 복잡한 작업에서 뛰어나지 않음을 보여줍니다.
책임 부인
줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.
저자에 관하여
Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.
더 많은 기사Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.