Nieuwsverslag Technologie
29 maart 2023

GPT-4 Presteert beter dan de gemiddelde persoon op een test van logisch redeneren, beweert onderzoek

In het kort

Ilya Pestov, een Russische AI-onderzoeker, creëerde de logische denktest, die door 12 duizend mensen werd gehaald.

Hij heeft onlangs toegang gekregen tot het slimmere GPT-4en voerde een experiment uit om te zien of de juiste zoekopdracht enige resultaten kon opleveren.

De resultaten toonden aan dat de GPT-4 presteerde beter dan de gemiddelde persoon in logisch redeneren.

Ilya Pestov, een bekende Russische AI-onderzoeker, plaatste een bericht op de zijne Telegram-kanaal over hoe goed het neurale netwerk omgaat met logische tests. Ilya heeft ooit de @psylogicbot logische denktest, die door ongeveer 12 duizend mensen werd afgelegd. Je kunt de statistieken bekijken nadat je de test hebt gemaakt.

@Midjourney / Abdalla(hamoXX)#7378
Lees verder: 20+ beste Telegram AI-chatbots van 2023

Hij schreef dat ChatGPT werd ook getest, maar de resultaten lieten veel te wensen over. Hij kreeg onlangs toegang tot de slimmere en meer bijgewerkte versie van de GPT model-GPT-4– en besloot te kijken of het vergelijkbare resultaten zou opleveren.

Het experiment verliep als volgt: De onderzoeker maakte een tekst die de taak beschreef die het neurale netwerk moest uitvoeren. De onderzoeker plaatste alles in de commentaren: De prompt was: “Ik zal je een logische puzzel en vier mogelijke antwoorden geven; kies het enige juiste antwoord van hen. Vervolgens creëerde Ilya voor elke testvraag een nieuw dialoogvenster en stuurde de GPT-4 beschrijving samen met de vraagtekst. De bot ontving het antwoord zonder correcties of hints.

Er zijn in totaal 25 vragen, waarbij voor elk juist antwoord één punt wordt toegekend. Volgens de statistieken scoren gebruikers gemiddeld 13.6 punten, met een mediaan van niet meer dan 14. Hoeveel heeft GPT-4 krijgen? Het lukte om 16 punten te behalen!

Nogmaals, het neurale netwerk presteert beter dan de gemiddelde persoon in logisch redeneren. Dat wil zeggen, het presteert beter dan de meerderheid van de geteste mensen. En dit is rekening houdend met:

  • De test is uitgevoerd in het Russisch, terwijl het model is afgestemd op het Engels;
  • GPT-4, dat in de chat wordt gebruikt, is minder intelligent dan zijn voorganger (een neveneffect van ethische beperkingen).

Afzonderlijk zullen we een uitstekend antwoord posten op vraag 22, waarin het neuron logica van de eerste orde gebruikte om het resultaat wiskundig af te leiden. Hoewel dit werd behandeld in toegepaste wiskunde, is het niet een universitaire cursus die iedereen volgt.

Afzonderlijk zullen we een uitstekend antwoord posten op vraag 22 waarin het neuron eerste-orde logica gebruikte om het resultaat wiskundig af te leiden. We wisten allemaal hoe het moest in de toegepaste wiskunde, maar het was een extra vak op de universiteit.

Geloof dat nog steeds neurale netwerken zijn een rage? Probeer eerst beter te presteren GPT-4 (en deel uw resultaten in de reacties).

Lees meer over AI:

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Meer artikelen
Damir Jalalov
Damir Jalalov

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Van Ripple tot The Big Green DAO: hoe cryptocurrency-projecten bijdragen aan liefdadigheid

Laten we initiatieven onderzoeken die het potentieel van digitale valuta voor goede doelen benutten.

Meer weten

AlphaFold 3, Med-Gemini en anderen: de manier waarop AI de gezondheidszorg transformeert in 2024

AI manifesteert zich op verschillende manieren in de gezondheidszorg, van het blootleggen van nieuwe genetische correlaties tot het versterken van robotchirurgische systemen...

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Biswap publiceert nieuwe strategische routekaart, richt zich op uitbreiding van meerdere ketens en introductie van liquide staking
Markten Nieuwsverslag Technologie
Biswap publiceert nieuwe strategische routekaart, richt zich op uitbreiding van meerdere ketens en introductie van liquide staking
24 mei 2024
Web3 AI onthuld: Jimmy Zhao legt uit hoe BNB Chain's integratie van Blockchain en AI Redefines Vertrouwen, transparantie en decentralisatie
Interview Business Markten Software Technologie
Web3 AI onthuld: Jimmy Zhao legt uit hoe BNB Chain's integratie van Blockchain en AI Redefines Vertrouwen, transparantie en decentralisatie
24 mei 2024
Hyperliquid onthult HIP-1 Spot Token-implementatiefunctie op zijn mainnet en beveelt testen aan voor een soepele implementatie
Nieuwsverslag Technologie
Hyperliquid onthult HIP-1 Spot Token-implementatiefunctie op zijn mainnet en beveelt testen aan voor een soepele implementatie
24 mei 2024
De beste deals van deze week, grote investeringen in AI, IT, Web3, en Crypto (20-24.05)
Verteren Toplijsten Business Lifestyle Markten Software Technologie
De beste deals van deze week, grote investeringen in AI, IT, Web3, en Crypto (20-24.05)
24 mei 2024