Αναφορά ειδήσεων Τεχνολογία
Ιούνιος 01, 2023

OpenAI: Η νέα μοντελοποίηση ανταμοιβής εποπτευόμενης διαδικασίας βελτιώνει τη συλλογιστική της τεχνητής νοημοσύνης

Εν συντομία

OpenAIΗ εποπτευόμενη από τη διαδικασία μοντελοποίηση ανταμοιβής (PRM) στοχεύει στην αξιολόγηση των ενδιάμεσων βημάτων και της λογικής των μοντέλων τεχνητής νοημοσύνης, οδηγώντας σε βελτιωμένες επιδόσεις και μετρήσεις.

OpenAI έχει για άλλη μια φορά τραβήξει την προσοχή της κοινότητας της τεχνητής νοημοσύνης με την πρωτοποριακή της δουλειά στη μοντελοποίηση ανταμοιβής υπό την επίβλεψη της διαδικασίας (ΑΜΕΑ). Αυτή η καινοτόμος προσέγγιση στοχεύει στην αξιολόγηση των ενδιάμεσων βημάτων και του συλλογισμού των μοντέλων τεχνητής νοημοσύνης, οδηγώντας σε βελτιωμένες επιδόσεις και μετρήσεις.

OpenAI: Η νέα μοντελοποίηση ανταμοιβής εποπτευόμενης διαδικασίας βελτιώνει τη συλλογιστική της τεχνητής νοημοσύνης
πίστωσης: Metaverse Post (mpost.io)
Συνιστάται: ChatGPT Θα μπορούσε να αλλάξει τη Wall Street κάνοντας τις συναλλαγές ευκολότερες

Στην παραδοσιακή μάθηση ενίσχυσης από την ανθρώπινη ανατροφοδότηση (RLHF), η ανάδραση του μοντέλου δίνεται συνήθως με βάση το συνολικό αποτέλεσμα που δημιουργείται από το μοντέλο. Ωστόσο, OpenAIΗ νέα έρευνα του διερευνά την ιδέα της αξιολόγησης των επιμέρους βημάτων και των διαδικασιών συλλογισμού που αναλαμβάνει το μοντέλο. Με αυτόν τον τρόπο, μπορούν να παρέχουν πιο λεπτομερείς αξιολογήσεις και σχόλια.

Για την αντιμετώπιση αυτού του προβλήματος, OpenAI επιλεγμένα μαθηματικά προβλήματα που απαιτούσαν πολλαπλές ενέργειες. Ενας ξεχωριστός μοντέλο εκπαιδεύτηκε να αξιολογεί αποτελεσματικά τα ενδιάμεσα βήματα, ενεργώντας ως κριτικός για να εντοπίσει τυχόν λανθασμένες κρίσεις που έγιναν από το πρωτεύον μοντέλο. Αυτή η διαδικασία όχι μόνο βελτιώνει τη συνολική απόδοση αλλά βελτιώνει επίσης τις μετρήσεις που χρησιμοποιούνται για την αξιολόγηση των δυνατοτήτων του μοντέλου.

OpenAI έχει κάνει σημαντικά βήματα σε αυτόν τον τομέα, με την κυκλοφορία ενός σχολαστικά επιμελημένου συνόλου δεδομένων που αποτελείται από 800,000 σημαδεμένες κρίσεις. Κάθε κρίση αντιπροσωπεύει ένα ξεχωριστό στάδιο στην επίλυση μαθηματικών προβλημάτων και δημιουργήθηκε με το χέρι. Αυτό υπογραμμίζει το επίπεδο αφοσίωσης και πόρων OpenAI επενδύει στην ανάπτυξη συνόλων δεδομένων υψηλής ποιότητας, εγείροντας ερωτήματα σχετικά με τον όγκο των δεδομένων που συλλέγονται για άλλους τομείς, όπως ο προγραμματισμός ή οι ερωτήσεις ανοιχτού τύπου.

Η εκπαίδευση του GPT-4, OpenAIτης τελευταίας επανάληψης του GPT σειρά, είναι ήδη σε εξέλιξη. Ενώ το στοιχείο RLHF δεν ενσωματώνεται στα τρέχοντα πειράματα, χρησιμοποιείται ένα μοντέλο καθαρής γλώσσας. Ιδιαίτερα, OpenAI αναφέρει ότι υπάρχουν πολλές εκδόσεις του GPT-4, με ακόμη και τη μικρότερη έκδοση να απαιτεί σημαντικά λιγότερους πόρους για εκπαίδευση—περίπου 200 φορές λιγότερους.

Ένα ενδιαφέρον παράδειγμα που μοιράστηκε από OpenAI δείχνει πώς το μοντέλο αξιολογεί κάθε μεμονωμένο βήμα απόφασης. Σε ένα στιγμιότυπο οθόνης που περιλαμβάνεται στην ανάρτηση, τα σφάλματα στη λύση επισημαίνονται και δίνεται η χαμηλότερη βαθμολογία ορθότητας, επισημαίνεται με κόκκινο χρώμα.
πίστωσης: OpenAI

Ένα ενδιαφέρον παράδειγμα που μοιράστηκε από OpenAI δείχνει πώς αξιολογεί το μοντέλο κάθε βήμα απόφασης. Σε ένα στιγμιότυπο οθόνης που περιλαμβάνεται στην ανάρτηση, τα σφάλματα στη λύση επισημαίνονται και δίνεται η χαμηλότερη βαθμολογία ορθότητας, επισημαίνεται με κόκκινο χρώμα. Αυτή η επίδειξη υπογραμμίζει την ικανότητα του μοντέλου να συλλογίζεται και παρέχει πολύτιμες γνώσεις για τη διαδικασία λήψης αποφάσεων. OpenAI έχει επίσης παράσχει οδηγίες για σημάνσεις, προσφέροντας ευκαιρίες στους crowdsourcers να συνεισφέρουν και να επωφεληθούν από το έργο τους.

As OpenAI συνεχίζει να πιέζει τα όρια της έρευνας για την τεχνητή νοημοσύνη, η εστίασή τους στη συλλογιστική των μοντέλων και στη μοντελοποίηση ανταμοιβής υπό την επίβλεψη της διαδικασίας φέρνει νέες δυνατότητες για βελτιωμένες δυνατότητες τεχνητής νοημοσύνης. Αυτή η τελευταία σημαντική ανακάλυψη δείχνει τη δέσμευσή τους για τη βελτίωση της απόδοσης του μοντέλου και ανοίγει πόρτες για περαιτέρω εξελίξεις στον τομέα.

Διαβάστε περισσότερα για το AI:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Περισσότερα άρθρα
Νταμίρ Γιαλάλοφ
Νταμίρ Γιαλάλοφ

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταια νεα

Η θεσμική όρεξη αυξάνεται προς τα ETF του Bitcoin εν μέσω αστάθειας

Οι αποκαλύψεις μέσω των καταθέσεων 13F αποκαλύπτουν αξιόλογους θεσμικούς επενδυτές που ασχολούνται με τα Bitcoin ETF, υπογραμμίζοντας την αυξανόμενη αποδοχή του ...

Μάθετε περισσότερα

Έφτασε η ημέρα της ποινής: Η μοίρα της CZ βρίσκεται σε ισορροπία καθώς το δικαστήριο των ΗΠΑ εξετάζει την ένσταση του DOJ

Ο Changpeng Zhao είναι έτοιμος να αντιμετωπίσει την καταδίκη σε αμερικανικό δικαστήριο στο Σιάτλ σήμερα.

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Διαβάστε Περισσότερα
Διάβασε περισσότερα
Η στροφή του Ντόναλντ Τραμπ στην κρυπτογράφηση: Από αντίπαλος σε συνήγορος και τι σημαίνει για την αγορά κρυπτονομισμάτων των ΗΠΑ
Business αγορές Ιστορίες και κριτικές Τεχνολογία
Η στροφή του Ντόναλντ Τραμπ στην κρυπτογράφηση: Από αντίπαλος σε συνήγορος και τι σημαίνει για την αγορά κρυπτονομισμάτων των ΗΠΑ
10 Μαΐου 2024
Layer3 για κυκλοφορία L3 Token αυτό το καλοκαίρι, κατανέμοντας το 51% της συνολικής προσφοράς στην κοινότητα
αγορές Αναφορά ειδήσεων Τεχνολογία
Layer3 για κυκλοφορία L3 Token αυτό το καλοκαίρι, κατανέμοντας το 51% της συνολικής προσφοράς στην κοινότητα
10 Μαΐου 2024
Η τελική προειδοποίηση του Έντουαρντ Σνόουντεν προς τους προγραμματιστές Bitcoin: «Κάντε το απόρρητο προτεραιότητα σε επίπεδο πρωτοκόλλου ή κινδυνεύετε να το χάσετε
αγορές Ασφάλεια Wiki λογισμικό Ιστορίες και κριτικές Τεχνολογία
Η τελική προειδοποίηση του Έντουαρντ Σνόουντεν προς τους προγραμματιστές Bitcoin: «Κάντε το απόρρητο προτεραιότητα σε επίπεδο πρωτοκόλλου ή κινδυνεύετε να το χάσετε
10 Μαΐου 2024
Το Optimism-Powered Ethereum Layer 2 Network Mint θα κυκλοφορήσει το Mainnet του στις 15 Μαΐου
Αναφορά ειδήσεων Τεχνολογία
Το Optimism-Powered Ethereum Layer 2 Network Mint θα κυκλοφορήσει το Mainnet του στις 15 Μαΐου
10 Μαΐου 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.