GPT-4 Præsterer bedre end den gennemsnitlige person på en test af logisk ræsonnement, undersøgelsespåstande
Kort sagt
Ilya Pestov, en russisk AI-forsker, skabte den logiske tanketest, som blev bestået af 12 tusinde mennesker.
Han fik for nylig adgang til det smartere GPT-4, og udførte et eksperiment for at se, om den rigtige forespørgsel kunne give nogle resultater.
Resultaterne viste, at GPT-4 udkonkurrerede den gennemsnitlige person i logisk ræsonnement.
Ilya Pestov, en velkendt russisk AI-forsker, sendte en besked på hans Telegramkanal om hvor godt det neurale netværk håndterer logiske tests. Ilya skabte engang @psylogicbot logisk tænkning test, som blev taget af cirka 12 tusinde mennesker. Du kan tjekke statistikken efter at have taget testen.
Læs mere: 20+ bedste Telegram AI Chatbots i 2023 |
Det skrev han ChatGPT blev også testet, men resultaterne lod meget tilbage at ønske. Han fik for nylig adgang til den smartere og mere opdaterede version af GPT model-GPT-4-og besluttede at kontrollere, om det ville få lignende resultater.
Forsøget blev udført som følger: Forskeren lavede en tekst, der beskrev den opgave, som det neurale netværk skulle udføre. Forskeren postede alt i kommentarerne: Spørgsmålet var: "Jeg vil give dig et logisk puslespil og fire mulige svar; vælg det ene rigtige svar blandt dem." Derefter oprettede Ilya en ny dialog for hvert testspørgsmål og sendte GPT-4 beskrivelse sammen med spørgsmålsteksten. Botten modtog svaret uden nogen rettelser eller hints.
Der er 25 spørgsmål i alt, hvor der gives et point for hvert korrekt svar. Ifølge statistikker scorer brugerne i gennemsnit 13.6 point med en median på højst 14. Hvor meget gjorde GPT-4 få? Det lykkedes at få 16 point!
Endnu en gang overgår det neurale netværk den gennemsnitlige person i logisk ræsonnement. Det vil sige, at den overgår flertallet af de testede. Og dette er efter at have taget højde for:
- Testen blev gennemført på russisk, mens modellen er finjusteret til engelsk;
- GPT-4, som bruges i chat, er mindre intelligent end sin forgænger (en bivirkning af etiske restriktioner).
Separat vil vi poste et fremragende svar på spørgsmål 22, hvor neuronen brugte førsteordens logik til at udlede resultatet matematisk. Selvom dette blev dækket i anvendt matematik, er det ikke et universitetskursus, alle tager.
Tror stadig på det neurale netværk er et modefænomen? Prøv først at overgå GPT-4 (og del dine resultater i kommentarerne).
Læs mere om AI:
Ansvarsfraskrivelse
I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.
Om forfatteren
Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.
Flere artiklerDamir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.