Αναφορά ειδήσεων Τεχνολογία
Μαρτίου 15, 2023

GPT-4 Υπερβαίνει GPT-3.5 Συνολικά για μια ποικιλία σημείων αναφοράς μελέτης

Εν συντομία

Η GPT-4 έχει επιτύχει υψηλότερο όριο βαθμού από το GPT-3.5 σε μια ποικιλία σημείων αναφοράς.

Αυτό είναι ένα σημαντικό επίτευγμα, καθώς δείχνει ότι οι μηχανές δεν είναι μόνο ικανές για ανθρώπινη νοημοσύνη, αλλά μπορούν επίσης να μας ξεπεράσουν, γεγονός που εγείρει ερωτήματα σχετικά με το μέλλον της τεχνητής νοημοσύνης και τον πιθανό αντίκτυπό της στην αγορά εργασίας.

GPT-4 έχει σημαντικά υψηλότερη απόδοση από τα μοντέλα τελευταίας τεχνολογίας (SOTA), συμπεριλαμβανομένων εκείνων που χρησιμοποιούν πρόσθετα πρωτόκολλα εκπαίδευσης ή σχεδιασμού για συγκεκριμένα σημεία αναφοράς, καθώς και από υπάρχοντα μοντέλα μεγάλων γλωσσών.

Η GPT-4 έχει πετύχει υψηλότερες βαθμολογίες από το GPT-3.5 σε μια ποικιλία σημείων αναφοράς. Αυτή είναι μια σημαντική ανακάλυψη για τις μηχανές, καθώς αποδεικνύει ότι μπορούν πλέον όχι μόνο να λύσουν προβλήματα για τα οποία είχαν σχεδιαστεί αρχικά, αλλά μπορούν επίσης να το κάνουν καλύτερα από τους φοιτητές πανεπιστημίου.

GPT-4 υπερέχει GPT-3.5 γενικά σε μια ποικιλία σημείων αναφοράς μελέτης

Υπάρχουν μερικά πράγματα που πρέπει να λάβετε υπόψη κατά την εξέταση αυτού του αποτελέσματος. Πρώτον, το GPT-4 δεν δόθηκε κάποια ειδική εκπαίδευση για αυτές τις εξετάσεις. Προχώρησε με τη χρήση των πιο πρόσφατων δημοσίως διαθέσιμων τεστ (στην περίπτωση των ερωτήσεων δωρεάν απόκρισης των Ολυμπιάδων και του AP) ή αγοράζοντας τις εκδόσεις 2022–2023 πρακτικών εξετάσεων. Δεύτερον, είναι σημαντικό να σημειωθεί ότι το GPT-4Η απόδοση του μπορεί να μην αντικατοπτρίζει απαραίτητα τις ικανότητες των ανθρώπων που κάνουν τεστ, καθώς λειτουργεί με διαφορετικό σύνολο αρχών και αλγορίθμων.

Αυτό είναι ένα σημαντικό επίτευγμα καθώς δείχνει ότι οι μηχανές δεν είναι μόνο ικανές για ανθρώπινη νοημοσύνη αλλά μπορούν επίσης να μας ξεπεράσουν. Αυτό ανοίγει το δρόμο για ένα μέλλον όπου οι μηχανές μπορούν να αναλάβουν όλο και πιο περίπλοκες εργασίες, οδηγώντας τελικά σε ένα μέλλον στο οποίο μπορούν να μας βοηθήσουν στην καθημερινή μας ζωή.

Η GPT-4Η ικανότητα του να ξεπερνά τους ανθρώπους σε ορισμένα καθήκοντα εγείρει ερωτήματα σχετικά με το μέλλον του τεχνητή νοημοσύνη και τον πιθανό αντίκτυπό της στην αγορά εργασίας. Υπογραμμίζει επίσης την ανάγκη για συνεχή έρευνα και ανάπτυξη σε αυτόν τον τομέα για να διασφαλιστεί ότι η τεχνητή νοημοσύνη χρησιμοποιείται ηθικά και υπεύθυνα.
Διαβάστε περισσότερα: 5+ πιο αναμενόμενα μοντέλα τεχνητής νοημοσύνης από κείμενο σε εικόνα του 2023

GPT-4, για παράδειγμα, περνάει μια προσομοίωση δικηγορικής εξέτασης με βαθμολογία στο κορυφαίο 10% των εξεταζομένων. GPT-3Η βαθμολογία του .5 ήταν στο κάτω 10%. Αυτή η σημαντική βελτίωση σε GPT-4Η απόδοση του οφείλεται στα μεγαλύτερα δεδομένα εκπαίδευσης και στη βελτιωμένη αρχιτεκτονική του. Αναμένεται να έχει ένα ευρύ φάσμα εφαρμογών σε διάφορους τομείς, συμπεριλαμβανομένης της επεξεργασίας φυσικής γλώσσας και της αυτοματοποιημένης γραφής.

 
GPT-4 παρουσιάζει επιδόσεις σε ανθρώπινο επίπεδο στις περισσότερες από αυτές τις επαγγελματικές και ακαδημαϊκές εξετάσεις. Αξίζει να σημειωθεί ότι πέρασε μια προσομοιωμένη έκδοση του Uniform Bar Examination με βαθμολογία στο κορυφαίο 10% των εξεταζομένων. Οι δυνατότητες του μοντέλου στις εξετάσεις φαίνεται να προέρχονται κυρίως από την προεκπαιδευτική διαδικασία και δεν επηρεάζονται σημαντικά από το RLHF. Σε ερωτήσεις πολλαπλής επιλογής, και οι δύο η βάση GPT-4 το μοντέλο και το μοντέλο RLHF είχαν εξίσου καλή απόδοση κατά μέσο όρο στους προγραμματιστές της εξέτασης που δοκιμάστηκαν.

Η πλειονότητα των μοντέλων τελευταίας τεχνολογίας (SOTA), συμπεριλαμβανομένων εκείνων που ενδέχεται να χρησιμοποιούν πρόσθετα πρωτόκολλα εκπαίδευσης ή σχεδιασμό συγκεκριμένου σημείου αναφοράς, καθώς και τα υπάρχοντα μεγάλα γλωσσικά μοντέλα, υπερέχουν σημαντικά από GPT-4.

GPT-4επιδόσεις του ως προς τα ακαδημαϊκά πρότυπα. Αντίθεση προγραμματιστών GPT-4 με το καλύτερο SOTA για μια αξιολόγηση λίγων βολών με LM καθώς και το καλύτερο SOTA με προπόνηση συγκεκριμένης αναφοράς. Με εξαίρεση το DROP, GPT-4 ξεπερνά όλα τα τρέχοντα LM σε όλα τα σημεία αναφοράς και το SOTA με εκπαίδευση για συγκεκριμένα σημεία αναφοράς.

Εσωτερικά, οι προγραμματιστές έχουν χρησιμοποιήσει GPT-4, το οποίο είχε σημαντικό αντίκτυπο σε δραστηριότητες όπως ο προγραμματισμός, οι πωλήσεις, η υποστήριξη και η εποπτεία περιεχομένου. Το δεύτερο στάδιο της μεθόδου ευθυγράμμισής μας βρίσκεται τώρα σε εξέλιξη, καθώς οι προγραμματιστές το χρησιμοποιούν για να βοηθήσουν τους ανθρώπους να αναθεωρήσουν τα αποτελέσματα της τεχνητής νοημοσύνης.

Το σύνολο δεδομένων MMLU (Massive Multi-Task Language Understanding) περιέχει ερωτήσεις από ένα πολύ ευρύ φάσμα θεμάτων για την κατανόηση της γλώσσας σε διαφορετικές εργασίες (που εκτείνονται σε 57 τομείς, συμπεριλαμβανομένων των μαθηματικών, της βιολογίας, του δικαίου, των κοινωνικών και ανθρωπιστικών επιστημών κ.λπ.). Υπάρχουν τέσσερις πιθανές απαντήσεις στην ερώτηση, μία από τις οποίες είναι σωστή. Δηλαδή, η τυχαία εικασία δείχνει αποτέλεσμα 25% σωστών απαντήσεων. Δείτε την παρακάτω εικόνα για παραδείγματα ερωτήσεων και τις δυσκολίες τους. Ο μέσος δείκτης (δηλαδή, δεν είναι επιστήμονας, ούτε καθηγητής - ένας συνηθισμένος άνθρωπος που φωτίζει το φεγγάρι ως σήμα) απαντά σωστά στο 35% των ερωτήσεων. Ωστόσο, οι ειδικοί μπορούν να φτάσουν σε βαθμολογία +/- 90%.

Επίδοση του GPT-4 σε μια σειρά γλωσσών σε σύγκριση με προηγούμενα μοντέλα στα αγγλικά στο MMLU. GPT-4 υπερβαίνει την απόδοση στην αγγλική γλώσσα των υπαρχόντων γλωσσικών μοντέλων για τη μεγάλη πλειονότητα των γλωσσών που εξετάστηκαν, συμπεριλαμβανομένων γλωσσών με χαμηλούς πόρους όπως τα λετονικά, τα ουαλικά και τα σουαχίλι.
Διαβάστε περισσότερα: 5 λόγοι για να χρησιμοποιήσετε το Bing με τεχνητή νοημοσύνη μέσω Google

Αρχικά, ολόκληρο το σύνολο δεδομένων ήταν στα αγγλικά. Τι γίνεται όμως αν οι ερωτήσεις και οι απαντήσεις μεταφράζονται σε άλλες γλώσσες, ειδικά σε λιγότερο συνηθισμένες; Θα τους δουλέψει κάπως το μοντέλο; Σε αυτήν τη δοκιμή, χρησιμοποιήθηκε η υπηρεσία Microsoft Azure Translate για μετάφραση. Οι μεταφράσεις δεν είναι τέλειες. Σε ορισμένες περιπτώσεις, χάνονται σημαντικές πληροφορίες. Ωστόσο, ακόμη και σε αυτή την περίπτωση, το GPT-4 έχει καλή απόδοση σε άλλες γλώσσες. Στις μεταφρασμένες εκδόσεις του MMLU, GPT-4 ξεπερνά το αγγλικό επίπεδο άλλων μεγάλων μοντέλων (συμπεριλαμβανομένου του Google) κατά 24 από τις 26 γλώσσες που εξετάστηκαν.

Επί πλέον, GPT-4 αποδίδει καλύτερα σε σπάνιες γλώσσες παρά ChatGPT έκανα στα αγγλικά (ChatGPT πέτυχε βαθμολογία 70.1%, ενώ η βαθμολογία του νέου μοντέλου για το Thai ήταν 71.8%). Η βαθμολογία για το τεστ στα αγγλικά ήταν η υψηλότερη, με GPT-4 απόδοση 10% καλύτερα από άλλα μοντέλα, συμπεριλαμβανομένου του μεγαλύτερου PalM από την Google. Πέτυχε βαθμολογία 86.4%, ενώ μια ομάδα ειδικών—90%.

  • Μέχρι το καλοκαίρι του 2023, η τεχνητή νοημοσύνη μπορεί να είχε φτάσει σε ένα νέο επίπεδο ισχύος χάρη σε αυτό ChatGPT, ένα chatbot που χρησιμοποιεί το GPT-4 αλγόριθμος και υπερέχει GPT-3 με συντελεστή 570. Μια ποικιλία στοιχείων συμβάλλει σε ChatGPTΗ επιτυχία του, συμπεριλαμβανομένου του σχεδιασμού του για να είναι πιο «ανθρώπινο» και της χρήσης της εξόρυξης δεδομένων αιχμής και της επεξεργασίας φυσικής γλώσσας για την αύξηση της αποτελεσματικότητας και της ακρίβειάς του.
  • Microsoft και OpenAI ανακοίνωσαν την ανανέωση της συνεργασίας τους και τα σχέδια για την αναζήτηση Bing για την υιοθέτηση δυνατοτήτων αναζήτησης ενισχυμένης με AI τον Ιανουάριο. Το πολύ εξελιγμένο GPTΑντικατάσταση μοντέλου 3.5, GPT4, μόλις κυκλοφόρησε, και έχει τη δυνατότητα να βελτιώσει σημαντικά την ικανότητα της αναζήτησης Bing να κατανοεί ερωτήματα φυσικής γλώσσας και να παρέχει πιο ακριβή αποτελέσματα. Είναι καλή ιδέα να έχετε ένα καλό εφεδρικό σχέδιο σε περίπτωση που κάτι πάει στραβά.

Διαβάστε περισσότερα σχετικά νέα:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Περισσότερα άρθρα
Νταμίρ Γιαλάλοφ
Νταμίρ Γιαλάλοφ

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταία νέα

Η θεσμική όρεξη αυξάνεται προς τα ETF του Bitcoin εν μέσω αστάθειας

Οι αποκαλύψεις μέσω των καταθέσεων 13F αποκαλύπτουν αξιόλογους θεσμικούς επενδυτές που ασχολούνται με τα Bitcoin ETF, υπογραμμίζοντας την αυξανόμενη αποδοχή του ...

Μάθετε περισσότερα

Έφτασε η ημέρα της ποινής: Η μοίρα της CZ βρίσκεται σε ισορροπία καθώς το δικαστήριο των ΗΠΑ εξετάζει την ένσταση του DOJ

Ο Changpeng Zhao είναι έτοιμος να αντιμετωπίσει την καταδίκη σε αμερικανικό δικαστήριο στο Σιάτλ σήμερα.

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Δείτε Περισσότερα
Διάβασε περισσότερα
Το Injective ενώνει τις δυνάμεις του με το AltLayer για να επαναφέρει την ασφάλεια στο inEVM
Business Αναφορά ειδήσεων Τεχνολογία
Το Injective ενώνει τις δυνάμεις του με το AltLayer για να επαναφέρει την ασφάλεια στο inEVM
3 Μαΐου 2024
Η Masa συνεργάζεται με το Teller για να εισαγάγει το MASA Lending Pool, ενεργοποιεί τον βασικό δανεισμό USDC
αγορές Αναφορά ειδήσεων Τεχνολογία
Η Masa συνεργάζεται με το Teller για να εισαγάγει το MASA Lending Pool, ενεργοποιεί τον βασικό δανεισμό USDC
3 Μαΐου 2024
Η Velodrome κυκλοφορεί την έκδοση Superchain Beta τις επόμενες εβδομάδες και επεκτείνεται σε όλες τις OP Stack Layer 2 Blockchains
αγορές Αναφορά ειδήσεων Τεχνολογία
Η Velodrome κυκλοφορεί την έκδοση Superchain Beta τις επόμενες εβδομάδες και επεκτείνεται σε όλες τις OP Stack Layer 2 Blockchains
3 Μαΐου 2024
Η CARV ανακοινώνει συνεργασία με την Aethir για την αποκέντρωση του επιπέδου δεδομένων της και τη διανομή ανταμοιβών
Business Αναφορά ειδήσεων Τεχνολογία
Η CARV ανακοινώνει συνεργασία με την Aethir για την αποκέντρωση του επιπέδου δεδομένων της και τη διανομή ανταμοιβών
3 Μαΐου 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.