Nyhetsrapport Teknologi
Mars 29, 2023

GPT-4 Presterar bättre än den genomsnittliga personen på ett test av logiskt resonemang, studera påståenden

I korthet

Ilya Pestov, en rysk AI-forskare, skapade det logiska tanketestet, som godkändes av 12 tusen människor.

Han fick nyligen tillgång till det smartare GPT-4, och genomförde ett experiment för att se om rätt fråga kunde ge några resultat.

Resultaten visade att GPT-4 överträffade den genomsnittliga personen i logiskt resonemang.

Ilya Pestov, en välkänd rysk AI-forskare, postade ett meddelande på hans Telegramkanal om hur väl det neurala nätverket hanterar logiska tester. Ilya skapade en gång @psylogicbot logiskt tänkande test, som togs av cirka 12 tusen människor. Du kan kolla in statistiken efter att ha tagit testet.

@Midjourney / Abdalla(hamoXX)#7378
Läs mer: 20+ bästa Telegram AI Chatbots 2023

Han skrev det ChatGPT testades också, men resultaten lämnade mycket övrigt att önska. Han fick nyligen tillgång till den smartare och mer uppdaterade versionen av GPT modell-GPT-4—och bestämde sig för att kontrollera om det skulle få liknande resultat.

Experimentet genomfördes på följande sätt: Forskaren skapade en text som beskrev uppgiften som det neurala nätverket skulle slutföra. Forskaren postade allt i kommentarerna: Uppmaningen var: "Jag ska ge dig ett logiskt pussel och fyra möjliga svar; välj det enda rätta svaret från dem." Sedan, för varje testfråga, skapade Ilya en ny dialogruta och skickade GPT-4 beskrivning tillsammans med frågetexten. Boten fick svaret utan några korrigeringar eller tips.

Det finns totalt 25 frågor, med en poäng för varje rätt svar. Enligt statistik får användarna i genomsnitt 13.6 poäng, med en median på högst 14. Hur mycket gjorde GPT-4 skaffa sig? Den lyckades få 16 poäng!

Återigen överträffar det neurala nätverket den genomsnittliga personen i logiskt resonemang. Det vill säga att den överträffar majoriteten av de testade. Och detta är efter att ha tagit hänsyn till:

  • Testet genomfördes på ryska, medan modellen är finjusterad för engelska;
  • GPT-4, som används i chatt, är mindre intelligent än sin föregångare (en bieffekt av etiska restriktioner).

Separat kommer vi att lägga upp ett utmärkt svar på fråga 22, där neuronen använde första ordningens logik för att härleda resultatet matematiskt. Även om detta behandlades i tillämpad matematik, är det inte en universitetskurs som alla tar.

Separat kommer vi att lägga upp ett utmärkt svar på fråga 22 där neuronen använde första ordningens logik för att härleda resultatet matematiskt. Vi visste alla hur man gjorde det i tillämpad matematik också, men det var en tilläggskurs på universitetet.

Tror fortfarande på det neurala nätverk är en modefluga? Försök först att överträffa GPT-4 (och dela dina resultat i kommentarerna).

Läs mer om AI:

Villkor

I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.

Om författaren

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

fler artiklar
Damir Yalalov
Damir Yalalov

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

Hot Stories
Gå med i vårt nyhetsbrev.
Senaste nytt

DOGE Frenzy: Analysera Dogecoins (DOGE) senaste ökning i värde

Kryptovalutaindustrin expanderar snabbt, och meme-mynt förbereder sig för en betydande uppgång. Dogecoin (DOGE), ...

Lär dig mer

Utvecklingen av AI-genererat innehåll i metaversen

Framväxten av generativt AI-innehåll är en av de mest fascinerande utvecklingarna i den virtuella miljön ...

Lär dig mer
Gå med i vår innovativa teknikgemenskap
Läs mer
Läs mer
Veckans bästa erbjudanden, stora investeringar i AI, IT, Web3, och Crypto (22-26.04)
Smälta Företag Marknader Teknologi
Veckans bästa erbjudanden, stora investeringar i AI, IT, Web3, och Crypto (22-26.04)
26 april 2024
Vitalik Buterin kommenterar centralisering av PoW, noterar att det var ett tillfälligt skede tills PoS
Nyhetsrapport Teknologi
Vitalik Buterin kommenterar centralisering av PoW, noterar att det var ett tillfälligt skede tills PoS
26 april 2024
Offchain Labs avslöjar upptäckten av två kritiska sårbarheter i Optimisms OP Stacks bedrägeribevis
Nyhetsrapport Mjukvara Teknologi
Offchain Labs avslöjar upptäckten av två kritiska sårbarheter i Optimisms OP Stacks bedrägeribevis
26 april 2024
Dymensions öppna marknad för att överbrygga likviditet från RollApps eIBC lanseras på Mainnet
Nyhetsrapport Teknologi
Dymensions öppna marknad för att överbrygga likviditet från RollApps eIBC lanseras på Mainnet 
26 april 2024