Nyheds rapport Teknologier
Marts 29, 2023

GPT-4 Præsterer bedre end den gennemsnitlige person på en test af logisk ræsonnement, undersøgelsespåstande

Kort sagt

Ilya Pestov, en russisk AI-forsker, skabte den logiske tanketest, som blev bestået af 12 tusinde mennesker.

Han fik for nylig adgang til det smartere GPT-4, og udførte et eksperiment for at se, om den rigtige forespørgsel kunne give nogle resultater.

Resultaterne viste, at GPT-4 udkonkurrerede den gennemsnitlige person i logisk ræsonnement.

Ilya Pestov, en velkendt russisk AI-forsker, sendte en besked på hans Telegramkanal om hvor godt det neurale netværk håndterer logiske tests. Ilya skabte engang @psylogicbot logisk tænkning test, som blev taget af cirka 12 tusinde mennesker. Du kan tjekke statistikken efter at have taget testen.

@Midjourney / Abdalla(hamoXX)#7378
Læs mere: 20+ bedste Telegram AI Chatbots i 2023

Det skrev han ChatGPT blev også testet, men resultaterne lod meget tilbage at ønske. Han fik for nylig adgang til den smartere og mere opdaterede version af GPT model-GPT-4-og besluttede at kontrollere, om det ville få lignende resultater.

Forsøget blev udført som følger: Forskeren lavede en tekst, der beskrev den opgave, som det neurale netværk skulle udføre. Forskeren postede alt i kommentarerne: Spørgsmålet var: "Jeg vil give dig et logisk puslespil og fire mulige svar; vælg det ene rigtige svar blandt dem." Derefter oprettede Ilya en ny dialog for hvert testspørgsmål og sendte GPT-4 beskrivelse sammen med spørgsmålsteksten. Botten modtog svaret uden nogen rettelser eller hints.

Der er 25 spørgsmål i alt, hvor der gives et point for hvert korrekt svar. Ifølge statistikker scorer brugerne i gennemsnit 13.6 point med en median på højst 14. Hvor meget gjorde GPT-4 få? Det lykkedes at få 16 point!

Endnu en gang overgår det neurale netværk den gennemsnitlige person i logisk ræsonnement. Det vil sige, at den overgår flertallet af de testede. Og dette er efter at have taget højde for:

  • Testen blev gennemført på russisk, mens modellen er finjusteret til engelsk;
  • GPT-4, som bruges i chat, er mindre intelligent end sin forgænger (en bivirkning af etiske restriktioner).

Separat vil vi poste et fremragende svar på spørgsmål 22, hvor neuronen brugte førsteordens logik til at udlede resultatet matematisk. Selvom dette blev dækket i anvendt matematik, er det ikke et universitetskursus, alle tager.

Separat vil vi poste et fremragende svar på spørgsmål 22, hvor neuronen brugte førsteordens logik til at udlede resultatet matematisk. Vi vidste også alle, hvordan man gjorde det i anvendt matematik, men det var et ekstra kursus på universitetet.

Tror stadig på det neurale netværk er et modefænomen? Prøv først at overgå GPT-4 (og del dine resultater i kommentarerne).

Læs mere om AI:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Hot Stories
Tilmeld dig vores nyhedsbrev.
Seneste Nyheder

DOGE Frenzy: Analyser Dogecoins (DOGE) seneste stigning i værdi

Kryptovalutaindustrien ekspanderer hurtigt, og meme-mønter forbereder sig på et markant opsving. Dogecoin (DOGE), ...

Vide mere

Udviklingen af ​​AI-genereret indhold i metaverset

Fremkomsten af ​​generativt AI-indhold er en af ​​de mest fascinerende udviklinger i det virtuelle miljø ...

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
Ugens bedste tilbud, store investeringer i AI, IT, Web3, og Crypto (22-26.04)
Fordøje Forretning Markeder Teknologier
Ugens bedste tilbud, store investeringer i AI, IT, Web3, og Crypto (22-26.04)
April 26, 2024
Vitalik Buterin kommenterer centralisering af PoW, bemærker, at det var midlertidigt indtil PoS
Nyheds rapport Teknologier
Vitalik Buterin kommenterer centralisering af PoW, bemærker, at det var midlertidigt indtil PoS
April 26, 2024
Offchain Labs afslører opdagelse af to kritiske sårbarheder i Optimisms OP Stacks bedrageribeviser
Nyheds rapport Software Teknologier
Offchain Labs afslører opdagelse af to kritiske sårbarheder i Optimisms OP Stacks bedrageribeviser
April 26, 2024
Dymensions åbne marked for at bygge bro over likviditet fra RollApps eIBC lanceres på Mainnet
Nyheds rapport Teknologier
Dymensions åbne marked for at bygge bro over likviditet fra RollApps eIBC lanceres på Mainnet 
April 26, 2024