Nieuwsverslag Technologie
29 maart 2023

GPT-4 Presteert beter dan de gemiddelde persoon op een test van logisch redeneren, beweert onderzoek

In het kort

Ilya Pestov, een Russische AI-onderzoeker, creëerde de logische denktest, die door 12 duizend mensen werd gehaald.

Hij heeft onlangs toegang gekregen tot het slimmere GPT-4en voerde een experiment uit om te zien of de juiste zoekopdracht enige resultaten kon opleveren.

De resultaten toonden aan dat de GPT-4 presteerde beter dan de gemiddelde persoon in logisch redeneren.

Ilya Pestov, een bekende Russische AI-onderzoeker, plaatste een bericht op de zijne Telegram-kanaal over hoe goed het neurale netwerk omgaat met logische tests. Ilya heeft ooit de @psylogicbot logische denktest, die door ongeveer 12 duizend mensen werd afgelegd. Je kunt de statistieken bekijken nadat je de test hebt gemaakt.

@Midjourney / Abdalla(hamoXX)#7378
Lees verder: 20+ beste Telegram AI-chatbots van 2023

Hij schreef dat ChatGPT werd ook getest, maar de resultaten lieten veel te wensen over. Hij kreeg onlangs toegang tot de slimmere en meer bijgewerkte versie van de GPT model-GPT-4– en besloot te kijken of het vergelijkbare resultaten zou opleveren.

Het experiment verliep als volgt: De onderzoeker maakte een tekst die de taak beschreef die het neurale netwerk moest uitvoeren. De onderzoeker plaatste alles in de commentaren: De prompt was: “Ik zal je een logische puzzel en vier mogelijke antwoorden geven; kies het enige juiste antwoord van hen. Vervolgens creëerde Ilya voor elke testvraag een nieuw dialoogvenster en stuurde de GPT-4 beschrijving samen met de vraagtekst. De bot ontving het antwoord zonder correcties of hints.

Er zijn in totaal 25 vragen, waarbij voor elk juist antwoord één punt wordt toegekend. Volgens de statistieken scoren gebruikers gemiddeld 13.6 punten, met een mediaan van niet meer dan 14. Hoeveel heeft GPT-4 krijgen? Het lukte om 16 punten te behalen!

Nogmaals, het neurale netwerk presteert beter dan de gemiddelde persoon in logisch redeneren. Dat wil zeggen, het presteert beter dan de meerderheid van de geteste mensen. En dit is rekening houdend met:

  • De test is uitgevoerd in het Russisch, terwijl het model is afgestemd op het Engels;
  • GPT-4, dat in de chat wordt gebruikt, is minder intelligent dan zijn voorganger (een neveneffect van ethische beperkingen).

Afzonderlijk zullen we een uitstekend antwoord posten op vraag 22, waarin het neuron logica van de eerste orde gebruikte om het resultaat wiskundig af te leiden. Hoewel dit werd behandeld in toegepaste wiskunde, is het niet een universitaire cursus die iedereen volgt.

Afzonderlijk zullen we een uitstekend antwoord posten op vraag 22 waarin het neuron eerste-orde logica gebruikte om het resultaat wiskundig af te leiden. We wisten allemaal hoe het moest in de toegepaste wiskunde, maar het was een extra vak op de universiteit.

Geloof dat nog steeds neurale netwerken zijn een rage? Probeer eerst beter te presteren GPT-4 (en deel uw resultaten in de reacties).

Lees meer over AI:

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Meer artikelen
Damir Jalalov
Damir Jalalov

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

De institutionele belangstelling groeit richting Bitcoin ETF’s te midden van volatiliteit

Uit openbaarmakingen via 13F-registraties blijkt dat opmerkelijke institutionele beleggers zich bezighouden met Bitcoin ETF's, wat een groeiende acceptatie onderstreept van ...

Meer weten

De dag van de veroordeling breekt aan: het lot van CZ hangt in evenwicht terwijl de Amerikaanse rechtbank het pleidooi van DOJ in overweging neemt

Changpeng Zhao staat vandaag op het punt te worden veroordeeld door een Amerikaanse rechtbank in Seattle.

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
MPost Sluit zich aan bij marktleiders in de 'Bitcoin verdient een emoji'-campagne, ter ondersteuning van de symboolintegratie van Bitcoin op elk virtueel toetsenbord
Lifestyle Nieuwsverslag Technologie
MPost Sluit zich aan bij marktleiders in de 'Bitcoin verdient een emoji'-campagne, ter ondersteuning van de symboolintegratie van Bitcoin op elk virtueel toetsenbord
10 mei 2024
Crypto Exchange OKX vermeldt Notcoin, die op 16 mei spothandel met een NIET-USDT-paar introduceert
Markten Nieuwsverslag Technologie
Crypto Exchange OKX vermeldt Notcoin, die op 16 mei spothandel met een NIET-USDT-paar introduceert  
10 mei 2024
Blast lanceert derde Blast Gold Distribution-evenement en wijst 15 miljoen punten toe aan DApps
Markten Nieuwsverslag Technologie
Blast lanceert derde Blast Gold Distribution-evenement en wijst 15 miljoen punten toe aan DApps
10 mei 2024
Espresso Systems werkt samen met Polygon Labs om AggLayer te ontwikkelen voor het verbeteren van de rollup-interoperabiliteit
Business Nieuwsverslag Technologie
Espresso Systems werkt samen met Polygon Labs om AggLayer te ontwikkelen voor het verbeteren van de rollup-interoperabiliteit
9 mei 2024