Nachrichtenbericht Technologie
29. März 2023

GPT-4 schneidet bei einem Test zum logischen Denken besser ab als die durchschnittliche Person, Studienaussagen

In Kürze

Ilya Pestov, ein russischer KI-Forscher, hat den Test zum logischen Denken entwickelt, den 12 Menschen bestanden haben.

Er hat kürzlich Zugang zum Smarter erhalten GPT-4und führte ein Experiment durch, um zu sehen, ob die richtige Abfrage einige Ergebnisse liefern könnte.

Die Ergebnisse zeigten, dass die GPT-4 übertraf den Durchschnittsmenschen im logischen Denken.

Ilya Pestov, ein bekannter russischer KI-Forscher, hat eine Nachricht auf seinem gepostet Telegrammkanal darüber, wie gut das neuronale Netz logische Tests handhabt. Ilya hat einmal die erstellt @psylogicbot logischer Denktest, der von ungefähr 12 Menschen absolviert wurde. Sie können sich die Statistiken ansehen, nachdem Sie den Test gemacht haben.

@Midjourney / Abdalla(hamoXX)#7378
Mehr lesen: 20+ beste Telegramm-KI-Chatbots von 2023

Das hat er geschrieben ChatGPT Wurde auch getestet, aber die Ergebnisse ließen zu wünschen übrig. Vor kurzem erhielt er Zugriff auf die intelligentere und aktuellere Version des GPT Modell-GPT-4– und beschloss zu prüfen, ob es zu ähnlichen Ergebnissen kommen würde.

Das Experiment wurde wie folgt durchgeführt: Der Forscher erstellte einen Text, der die Aufgabe beschrieb, die das neuronale Netzwerk erfüllen musste. Der Forscher postete alles in den Kommentaren: Die Aufforderung lautete: „Ich gebe Ihnen ein Logikrätsel und vier mögliche Antworten; Wählen Sie aus ihnen die eine richtige Antwort aus.“ Dann erstellte Ilya für jede Testfrage einen neuen Dialog und schickte ihn GPT-4 Beschreibung zusammen mit dem Fragetext. Der Bot erhielt die Antwort ohne Korrekturen oder Hinweise.

Insgesamt gibt es 25 Fragen, wobei für jede richtige Antwort ein Punkt vergeben wird. Laut Statistik erreichen Nutzer durchschnittlich 13.6 Punkte, der Median liegt bei maximal 14. Wie viel haben sie erreicht? GPT-4 erhalten? Es wurden 16 Punkte geholt!

Wieder einmal übertrifft das neuronale Netzwerk den Durchschnittsmenschen beim logischen Denken. Das heißt, es übertrifft die Mehrheit der getesteten Personen. Und dies nach Berücksichtigung:

  • Der Test wurde auf Russisch durchgeführt, während das Modell auf Englisch abgestimmt ist;
  • GPT-4, das im Chat verwendet wird, ist weniger intelligent als sein Vorgänger (ein Nebeneffekt ethischer Einschränkungen).

Separat werden wir eine ausgezeichnete Antwort auf Frage 22 veröffentlichen, in der das Neuron die Logik erster Ordnung verwendet hat, um das Ergebnis mathematisch abzuleiten. Dies wurde zwar in angewandter Mathematik behandelt, ist aber kein Universitätskurs, den jeder belegt.

Unabhängig davon werden wir eine hervorragende Antwort auf Frage 22 posten, in der das Neuron die Logik erster Ordnung verwendet hat, um das Ergebnis mathematisch abzuleiten. Das konnten wir alle auch in der angewandten Mathematik, aber das war ein Zusatzstudium an der Uni.

Glaube das immer noch Neuronale Netze sind eine Modeerscheinung? Versuchen Sie zunächst, Ihre Leistung zu übertreffen GPT-4 (und teilen Sie Ihre Ergebnisse in den Kommentaren).

Lesen Sie mehr über KI:

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Weitere Artikel
Damir Jalalow
Damir Jalalow

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Der DOGE-Raserei: Analyse des jüngsten Wertanstiegs von Dogecoin (DOGE).

Die Kryptowährungsbranche wächst rasant und Meme-Coins bereiten sich auf einen deutlichen Aufschwung vor. Dogecoin (DOGE), ...

Weitere Informationen

Die Entwicklung KI-generierter Inhalte im Metaversum

Das Aufkommen generativer KI-Inhalte ist eine der faszinierendsten Entwicklungen in der virtuellen Umgebung ...

Weitere Informationen
Treten Sie unserer innovativen Tech-Community bei
Weiterlesen
Lesen Sie weiter
Die Top-Angebote dieser Woche, große Investitionen in KI, IT, Web3, und Krypto (22-26.04)
Digest Geschäft Märkte Technologie
Die Top-Angebote dieser Woche, große Investitionen in KI, IT, Web3, und Krypto (22-26.04)
26. April 2024
Vitalik Buterin kommentiert die Zentralisierung von PoW und stellt fest, dass es sich bis zum PoS um eine vorübergehende Phase handelte
Nachrichtenbericht Technologie
Vitalik Buterin kommentiert die Zentralisierung von PoW und stellt fest, dass es sich bis zum PoS um eine vorübergehende Phase handelte
26. April 2024
Offchain Labs enthüllt die Entdeckung zweier kritischer Schwachstellen in den Betrugsnachweisen des OP-Stacks von Optimism
Nachrichtenbericht Software Technologie
Offchain Labs enthüllt die Entdeckung zweier kritischer Schwachstellen in den Betrugsnachweisen des OP-Stacks von Optimism
26. April 2024
Dymensions offener Markt zur Überbrückung der Liquidität von RollApps eIBC startet im Mainnet
Nachrichtenbericht Technologie
Dymensions offener Markt zur Überbrückung der Liquidität von RollApps eIBC startet im Mainnet 
26. April 2024