뉴스 보도 Technology
2023 년 3 월 29 일

GPT-4 논리적 추론 테스트에서 일반 사람보다 더 나은 성과를 낸다는 연구 주장

요컨대

러시아 AI 연구원 Ilya Pestov는 논리적 사고 테스트를 만들었고 12명이 통과했습니다.

그는 최근에 더 스마트한 기기에 접근할 수 있게 되었습니다. GPT-4, 올바른 쿼리가 일부 결과를 얻을 수 있는지 확인하기 위해 실험을 수행했습니다.

결과는 GPT-4 논리적 추론에서 보통 사람을 능가했습니다.

유명한 러시아 AI 연구원 Ilya Pestov는 자신의 메시지를 게시했습니다. 텔레 그램 채널 신경망이 논리적 테스트를 얼마나 잘 처리하는지에 대해. Ilya는 한때 @싸이로직봇 약 12명이 응시한 논리적 사고 테스트. 시험을 치른 후 통계를 확인할 수 있습니다.

@Midjourney / 압달라(hamoXX)#7378
더 읽기 : 20년 최고의 텔레그램 AI 챗봇 2023개 이상

그는 썼다 ChatGPT 테스트도 받았지만 결과는 아쉬운 점이 많았습니다. 그는 최근에 더 스마트하고 업데이트된 버전에 액세스할 수 있게 되었습니다. GPT 모델-GPT-4—그리고 비슷한 결과가 나올지 확인하기로 결정했습니다.

실험은 다음과 같이 수행되었습니다. 연구원은 신경망이 완료해야 하는 작업을 설명하는 텍스트를 만들었습니다. 연구원은 의견에 모든 것을 게시했습니다. 프롬프트는 다음과 같습니다. “논리 퍼즐과 네 가지 가능한 답변을 제공하겠습니다. 그들 중 하나의 정답을 선택하십시오.” 그런 다음 각 테스트 질문에 대해 Ilya는 새 대화 상자를 만들고 다음을 보냈습니다. GPT-4 질문 텍스트와 함께 설명. 봇은 수정이나 힌트 없이 응답을 받았습니다.

총 25개의 질문이 있으며 각 정답에 13.6점이 부여됩니다. 통계에 따르면 사용자는 평균 14점을 얻었으며 평균 점수는 XNUMX점을 넘지 않았습니다. GPT-4 얻다? 16점 획득에 성공했습니다!

다시 한 번, 신경망은 논리적 추론에서 보통 사람을 능가합니다. 즉, 테스트한 대부분의 사람들보다 성능이 뛰어납니다. 그리고 이것은 다음을 고려한 후입니다.

  • 테스트는 러시아어로 진행되었으며 모델은 영어에 맞게 미세 조정되었습니다.
  • GPT-4채팅에 사용되는 는 이전 버전보다 지능이 떨어집니다(윤리적 제한의 부작용).

별도로, 뉴런이 22차 논리를 사용하여 결과를 수학적으로 도출한 XNUMX번 질문에 대한 탁월한 답변을 게시할 것입니다. 이것은 응용 수학에서 다루었지만 모든 사람이 듣는 대학 과정은 아닙니다.

별도로 뉴런이 22차 논리를 사용하여 결과를 수학적으로 도출한 XNUMX번 질문에 대한 훌륭한 답변을 게시할 것입니다. 우리 모두는 응용 수학에서도 그것을 하는 방법을 알고 있었지만 그것은 대학에서 추가 과정이었습니다.

그래도 믿어 신경망 유행이야? 첫째, 더 나은 성과를 내도록 노력하라 GPT-4 (결과를 댓글로 공유해주세요)

AI에 대해 자세히 알아보기:

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

DOGE 광란: Dogecoin(DOGE)의 최근 가치 급등 분석

암호화폐 산업은 급속도로 확장되고 있으며, 밈 코인은 상당한 상승세를 준비하고 있습니다. 도지코인(DOGE), ...

현장 사진

메타버스에서 AI 생성 콘텐츠의 진화

생성적 AI 콘텐츠의 출현은 가상 환경 내에서 가장 흥미로운 발전 중 하나입니다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
이번주 주요 딜, AI, IT 분야 주요 투자, Web3및 암호화폐(22-26.04)
요람 근무지에서 발생 시장 Technology
이번주 주요 딜, AI, IT 분야 주요 투자, Web3및 암호화폐(22-26.04)
2024 년 4 월 26 일
Vitalik Buterin은 PoW의 중앙화에 대해 논평하며 PoS까지는 임시 단계였다고 언급
뉴스 보도 Technology
Vitalik Buterin은 PoW의 중앙화에 대해 논평하며 PoS까지는 임시 단계였다고 언급
2024 년 4 월 26 일
Offchain Labs는 Optimism의 OP 스택 사기 증명에서 두 가지 중요한 취약점을 발견했습니다.
뉴스 보도 소프트웨어 Technology
Offchain Labs는 Optimism의 OP 스택 사기 증명에서 두 가지 중요한 취약점을 발견했습니다.
2024 년 4 월 26 일
RollApps의 유동성 연결을 위한 Dymension의 공개 시장 eIBC, 메인넷 출시
뉴스 보도 Technology
RollApps의 유동성 연결을 위한 Dymension의 공개 시장 eIBC, 메인넷 출시 
2024 년 4 월 26 일
CRYPTOMERIA LABS PTE. LTD.