Αναφορά ειδήσεων Τεχνολογία
Μαρτίου 29, 2023

GPT-4 Αποδίδει καλύτερα από το μέσο άτομο σε μια δοκιμή λογικής συλλογιστικής, ισχυρισμοί μελέτης

Εν συντομία

Ο Ilya Pestov, ένας Ρώσος ερευνητής AI, δημιούργησε το τεστ λογικής σκέψης, το οποίο πέρασαν 12 χιλιάδες άτομα.

Πρόσφατα απέκτησε πρόσβαση στο πιο έξυπνο GPT-4, και διεξήγαγε ένα πείραμα για να δούμε αν το σωστό ερώτημα θα μπορούσε να αποφέρει κάποια αποτελέσματα.

Τα αποτελέσματα έδειξαν ότι η GPT-4 ξεπέρασε τον μέσο άνθρωπο στον λογικό συλλογισμό.

Ο Ilya Pestov, ένας γνωστός Ρώσος ερευνητής AI, δημοσίευσε ένα μήνυμα στο δικό του Τηλεοπτικό κανάλι για το πόσο καλά χειρίζεται το νευρωνικό δίκτυο τις λογικές δοκιμές. Ο Ilya δημιούργησε κάποτε το @psylogicbot τεστ λογικής σκέψης, που πραγματοποιήθηκε από περίπου 12 χιλιάδες άτομα. Μπορείτε να δείτε τα στατιστικά μετά τη λήψη του τεστ.

@Midjourney / Abdalla(hamoXX)#7378
Διαβάστε περισσότερα: 20+ καλύτερα Telegram AI Chatbots του 2023

Το έγραψε ChatGPT επίσης δοκιμάστηκε, αλλά τα αποτελέσματα άφησαν πολλά να είναι επιθυμητά. Πρόσφατα απέκτησε πρόσβαση στην πιο έξυπνη και πιο ενημερωμένη έκδοση του GPT μοντέλο-GPT-4—και αποφάσισε να ελέγξει αν θα είχε παρόμοια αποτελέσματα.

Το πείραμα διεξήχθη ως εξής: Ο ερευνητής δημιούργησε ένα κείμενο που περιέγραφε την εργασία που έπρεπε να ολοκληρώσει το νευρωνικό δίκτυο. Ο ερευνητής δημοσίευσε τα πάντα στα σχόλια: Η προτροπή ήταν: «Θα σας δώσω ένα λογικό παζλ και τέσσερις πιθανές απαντήσεις. επιλέξτε τη μία σωστή απάντηση από αυτούς." Στη συνέχεια, για κάθε δοκιμαστική ερώτηση, ο Ilya δημιούργησε ένα νέο παράθυρο διαλόγου και έστειλε το GPT-4 περιγραφή μαζί με το κείμενο της ερώτησης. Το bot έλαβε την απάντηση χωρίς διορθώσεις ή υποδείξεις.

Υπάρχουν 25 ερωτήσεις συνολικά, με έναν βαθμό για κάθε σωστή απάντηση. Σύμφωνα με στατιστικά στοιχεία, οι χρήστες σημειώνουν 13.6 πόντους κατά μέσο όρο, με διάμεσο όχι περισσότερο από 14. Πόσο GPT-4 παίρνω? Κατάφερε να πάρει 16 βαθμούς!

Για άλλη μια φορά, το νευρωνικό δίκτυο υπερτερεί του μέσου ανθρώπου σε λογικούς συλλογισμούς. Δηλαδή, ξεπερνά την πλειονότητα των ατόμων που δοκιμάστηκαν. Και αυτό αφού ληφθούν υπόψη:

  • Η δοκιμή διεξήχθη στα ρωσικά, ενώ το μοντέλο είναι βελτιωμένο στα αγγλικά.
  • GPT-4, το οποίο χρησιμοποιείται στη συνομιλία, είναι λιγότερο έξυπνο από τον προκάτοχό του (παρενέργεια ηθικών περιορισμών).

Ξεχωριστά, θα δημοσιεύσουμε μια εξαιρετική απάντηση στην ερώτηση 22, στην οποία ο νευρώνας χρησιμοποίησε λογική πρώτης τάξης για να εξαγάγει το αποτέλεσμα μαθηματικά. Αν και αυτό καλύφθηκε στα εφαρμοσμένα μαθηματικά, δεν είναι πανεπιστημιακό μάθημα που παρακολουθούν όλοι.

Ξεχωριστά, θα δημοσιεύσουμε μια εξαιρετική απάντηση στην ερώτηση 22 στην οποία ο νευρώνας χρησιμοποίησε λογική πρώτης τάξης για να εξαγάγει το αποτέλεσμα μαθηματικά. Όλοι ξέραμε πώς να το κάνουμε και στα εφαρμοσμένα μαθηματικά, αλλά ήταν ένα επιπλέον μάθημα στο πανεπιστήμιο.

Ακόμα να το πιστεύεις νευρωνικά δίκτυα είναι μόδα; Πρώτον, προσπαθήστε να έχετε καλύτερη απόδοση GPT-4 (και μοιραστείτε τα αποτελέσματά σας στα σχόλια).

Διαβάστε περισσότερα για το AI:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Περισσότερα άρθρα
Νταμίρ Γιαλάλοφ
Νταμίρ Γιαλάλοφ

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταια νεα

Η θεσμική όρεξη αυξάνεται προς τα ETF του Bitcoin εν μέσω αστάθειας

Οι αποκαλύψεις μέσω των καταθέσεων 13F αποκαλύπτουν αξιόλογους θεσμικούς επενδυτές που ασχολούνται με τα Bitcoin ETF, υπογραμμίζοντας την αυξανόμενη αποδοχή του ...

Μάθετε περισσότερα

Έφτασε η ημέρα της ποινής: Η μοίρα της CZ βρίσκεται σε ισορροπία καθώς το δικαστήριο των ΗΠΑ εξετάζει την ένσταση του DOJ

Ο Changpeng Zhao είναι έτοιμος να αντιμετωπίσει την καταδίκη σε αμερικανικό δικαστήριο στο Σιάτλ σήμερα.

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Διαβάστε Περισσότερα
Διάβασε περισσότερα
Η στροφή του Ντόναλντ Τραμπ στην κρυπτογράφηση: Από αντίπαλος σε συνήγορος και τι σημαίνει για την αγορά κρυπτονομισμάτων των ΗΠΑ
Business αγορές Ιστορίες και κριτικές Τεχνολογία
Η στροφή του Ντόναλντ Τραμπ στην κρυπτογράφηση: Από αντίπαλος σε συνήγορος και τι σημαίνει για την αγορά κρυπτονομισμάτων των ΗΠΑ
10 Μαΐου 2024
Layer3 για κυκλοφορία L3 Token αυτό το καλοκαίρι, κατανέμοντας το 51% της συνολικής προσφοράς στην κοινότητα
αγορές Αναφορά ειδήσεων Τεχνολογία
Layer3 για κυκλοφορία L3 Token αυτό το καλοκαίρι, κατανέμοντας το 51% της συνολικής προσφοράς στην κοινότητα
10 Μαΐου 2024
Η τελική προειδοποίηση του Έντουαρντ Σνόουντεν προς τους προγραμματιστές Bitcoin: «Κάντε το απόρρητο προτεραιότητα σε επίπεδο πρωτοκόλλου ή κινδυνεύετε να το χάσετε
αγορές Ασφάλεια Wiki λογισμικό Ιστορίες και κριτικές Τεχνολογία
Η τελική προειδοποίηση του Έντουαρντ Σνόουντεν προς τους προγραμματιστές Bitcoin: «Κάντε το απόρρητο προτεραιότητα σε επίπεδο πρωτοκόλλου ή κινδυνεύετε να το χάσετε
10 Μαΐου 2024
Το Optimism-Powered Ethereum Layer 2 Network Mint θα κυκλοφορήσει το Mainnet του στις 15 Μαΐου
Αναφορά ειδήσεων Τεχνολογία
Το Optimism-Powered Ethereum Layer 2 Network Mint θα κυκλοφορήσει το Mainnet του στις 15 Μαΐου
10 Μαΐου 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.