Nieuwsverslag Technologie
29 maart 2023

GPT-4 Presteert beter dan de gemiddelde persoon op een test van logisch redeneren, beweert onderzoek

In het kort

Ilya Pestov, een Russische AI-onderzoeker, creëerde de logische denktest, die door 12 duizend mensen werd gehaald.

Hij heeft onlangs toegang gekregen tot het slimmere GPT-4en voerde een experiment uit om te zien of de juiste zoekopdracht enige resultaten kon opleveren.

De resultaten toonden aan dat de GPT-4 presteerde beter dan de gemiddelde persoon in logisch redeneren.

Ilya Pestov, een bekende Russische AI-onderzoeker, plaatste een bericht op de zijne Telegram-kanaal over hoe goed het neurale netwerk omgaat met logische tests. Ilya heeft ooit de @psylogicbot logische denktest, die door ongeveer 12 duizend mensen werd afgelegd. Je kunt de statistieken bekijken nadat je de test hebt gemaakt.

@Midjourney / Abdalla(hamoXX)#7378
Lees verder: 20+ beste Telegram AI-chatbots van 2023

Hij schreef dat ChatGPT werd ook getest, maar de resultaten lieten veel te wensen over. Hij kreeg onlangs toegang tot de slimmere en meer bijgewerkte versie van de GPT model-GPT-4– en besloot te kijken of het vergelijkbare resultaten zou opleveren.

Het experiment verliep als volgt: De onderzoeker maakte een tekst die de taak beschreef die het neurale netwerk moest uitvoeren. De onderzoeker plaatste alles in de commentaren: De prompt was: “Ik zal je een logische puzzel en vier mogelijke antwoorden geven; kies het enige juiste antwoord van hen. Vervolgens creëerde Ilya voor elke testvraag een nieuw dialoogvenster en stuurde de GPT-4 beschrijving samen met de vraagtekst. De bot ontving het antwoord zonder correcties of hints.

Er zijn in totaal 25 vragen, waarbij voor elk juist antwoord één punt wordt toegekend. Volgens de statistieken scoren gebruikers gemiddeld 13.6 punten, met een mediaan van niet meer dan 14. Hoeveel heeft GPT-4 krijgen? Het lukte om 16 punten te behalen!

Nogmaals, het neurale netwerk presteert beter dan de gemiddelde persoon in logisch redeneren. Dat wil zeggen, het presteert beter dan de meerderheid van de geteste mensen. En dit is rekening houdend met:

  • De test is uitgevoerd in het Russisch, terwijl het model is afgestemd op het Engels;
  • GPT-4, dat in de chat wordt gebruikt, is minder intelligent dan zijn voorganger (een neveneffect van ethische beperkingen).

Afzonderlijk zullen we een uitstekend antwoord posten op vraag 22, waarin het neuron logica van de eerste orde gebruikte om het resultaat wiskundig af te leiden. Hoewel dit werd behandeld in toegepaste wiskunde, is het niet een universitaire cursus die iedereen volgt.

Afzonderlijk zullen we een uitstekend antwoord posten op vraag 22 waarin het neuron eerste-orde logica gebruikte om het resultaat wiskundig af te leiden. We wisten allemaal hoe het moest in de toegepaste wiskunde, maar het was een extra vak op de universiteit.

Geloof dat nog steeds neurale netwerken zijn een rage? Probeer eerst beter te presteren GPT-4 (en deel uw resultaten in de reacties).

Lees meer over AI:

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Meer artikelen
Damir Jalalov
Damir Jalalov

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

De DOGE Frenzy: analyse van de recente waardestijging van Dogecoin (DOGE).

De cryptocurrency-industrie breidt zich snel uit en meme-munten bereiden zich voor op een aanzienlijke opleving. Dogecoin (DOGE), ...

Meer weten

De evolutie van door AI gegenereerde inhoud in de Metaverse

De opkomst van generatieve AI-inhoud is een van de meest fascinerende ontwikkelingen binnen de virtuele omgeving...

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
De beste deals van deze week, grote investeringen in AI, IT, Web3, en Crypto (22-26.04)
Verteren Business Markten Technologie
De beste deals van deze week, grote investeringen in AI, IT, Web3, en Crypto (22-26.04)
26 april 2024
Vitalik Buterin geeft commentaar op de centralisatie van krijgsgevangenen en merkt op dat dit een tijdelijke fase was tot PoS
Nieuwsverslag Technologie
Vitalik Buterin geeft commentaar op de centralisatie van krijgsgevangenen en merkt op dat dit een tijdelijke fase was tot PoS
26 april 2024
Offchain Labs onthult ontdekking van twee kritieke kwetsbaarheden in de fraudebewijzen van Optimism's OP Stack
Nieuwsverslag Software Technologie
Offchain Labs onthult ontdekking van twee kritieke kwetsbaarheden in de fraudebewijzen van Optimism's OP Stack
26 april 2024
Dymension's open markt voor het overbruggen van de liquiditeit van RollApps eIBC wordt gelanceerd op Mainnet
Nieuwsverslag Technologie
Dymension's open markt voor het overbruggen van de liquiditeit van RollApps eIBC wordt gelanceerd op Mainnet 
26 april 2024