Αναφορά ειδήσεων Τεχνολογία
Μαρτίου 15, 2023

OpenAI Συγκεντρώνει μια ομάδα 50+ ειδικών για βελτίωση GPT-4Ασφάλεια του

Εν συντομία

OpenAI έχει προσλάβει μια ομάδα άνω των 50 εμπειρογνωμόνων για να διασφαλίσει ότι είναι το νεότερο γλωσσικό μοντέλο, GPT-4, είναι ασφαλές για χρήση.

Η ομάδα περιλαμβάνει ερευνητές και μηχανικούς που ειδικεύονται στην ασφάλεια, την ηθική και την πολιτική τεχνητής νοημοσύνης.

Στόχος είναι η πρόληψη GPT-4 από τη δημιουργία επιβλαβούς ή μεροληπτικού περιεχομένου και να διασφαλίζει ότι ευθυγραμμίζεται με τις ανθρώπινες αξίες.

OpenAI Συγκεντρώνει μια ομάδα 50+ ειδικών για βελτίωση GPT-4Ασφάλεια του

OpenAI έχει προσλάβει πάνω από 50 ειδικούς από διάφορους τομείς για να κάνει GPT-4 ασφαλέστερα. Οι εμπειρογνώμονες εργάζονται με αντίθετες δοκιμές του μοντέλου για τον εντοπισμό πιθανών κινδύνων και τρωτών σημείων. Είναι ειδικοί από διάφορους τομείς: μακροπρόθεσμους κινδύνους ευθυγράμμισης με τεχνητή νοημοσύνη, ασφάλεια στον κυβερνοχώρο, βιορίσκο και διεθνή ασφάλεια. Τα ευρήματά τους βοήθησαν OpenAI αξιολογήστε τη συμπεριφορά του μοντέλου σε τομείς υψηλού κινδύνου που απαιτούν εξειδικευμένη τεχνογνωσία. 

Ενώ το νεότερο γλωσσικό μοντέλο εγκυμονεί παρόμοιους κινδύνους με τα μικρότερα γλωσσικά μοντέλα, οι πρόσθετες δυνατότητες του GPT-4 οδηγεί σε νέες απειλές. Έτσι, η δέσμευση ειδικών ήταν ζωτικής σημασίας για τη διασφάλιση της ασφάλειας της τεχνολογίας.

OpenAI έχει εφαρμόσει ένα πρόσθετο σύνολο ενισχυτικής μάθησης σχετικών με την ασφάλεια από προτροπές εκπαίδευσης για τις ανθρώπινες προτιμήσεις (RLHF) και μοντέλα ανταμοιβής που βασίζονται σε κανόνες (RBRMs) για τη βελτίωση της ασφάλειας του GPT-4 μοντέλο. Τα RBRM είναι μηδενικά GPT-4 ταξινομητές που λειτουργούν ως πρόσθετο σήμα ανταμοιβής για το GPT-4 μοντέλο πολιτικής κατά τη μικρορύθμιση του RLHF. Σκοπός τους είναι να παρακινήσουν την κατάλληλη συμπεριφορά, όπως η άρνηση δημιουργίας επιβλαβούς περιεχομένου ή η μη απόρριψη αβλαβών αιτημάτων.

Για να διασφαλιστεί η ασφάλεια των GPT-4 μοντέλα, OpenAI άρχισε να προσλαμβάνει εξωτερικούς εμπειρογνώμονες τον Αύγουστο του 2022 για τη διεξαγωγή ασκήσεων «κόκκινης ομαδικότητας», συμπεριλαμβανομένων των δοκιμών ακραίων καταστάσεων, των δοκιμών ορίων και των δοκιμών αντιπάλου. Είχαν πρόσβαση σε πρώιμες εκδόσεις του GPT-4 μοντέλο και εντόπισε αρχικούς κινδύνους που παρακίνησαν περαιτέρω έρευνα για την ασφάλεια.

Τα σχόλια των ειδικών οδήγησαν σε τεχνικούς μετριασμούς και μέτρα επιβολής της πολιτικής για τη μείωση των κινδύνων. Ωστόσο, εξακολουθούν να υπάρχουν πολλές απειλές και απαιτείται περαιτέρω αξιολόγηση.

Μιλώντας για τους εργαζόμενους στο OpenAI, ChatGPT ήταν αρχικά αναπτύχθηκε με τη βοήθεια ατόμων σε ορισμένες από τις φτωχότερες περιοχές του κόσμου OpenAIσυνεργασία του με μια εταιρεία που ονομάζεται Sama, η οποία απασχολεί εκατομμύρια εργαζομένους από φτωχές περιοχές. Ορισμένοι ειδικοί στην ηθική της τεχνητής νοημοσύνης έχουν ασκήσει κριτική OpenAIαπόφαση του να αναθέσει σε εξωτερικούς συνεργάτες την εκπαίδευση του ChatGPT μοντέλο στη Sama, κατηγορώντας την εταιρεία για εκμετάλλευση χαμηλού κόστους εργασίας.

Διαβάστε περισσότερα:

Ετικέτες:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Η Agne είναι μια δημοσιογράφος που καλύπτει τις τελευταίες τάσεις και εξελίξεις στο metaverse, AI και Web3 βιομηχανίες για την Metaverse Post. Το πάθος της για την αφήγηση την οδήγησε να πραγματοποιήσει πολυάριθμες συνεντεύξεις με ειδικούς σε αυτούς τους τομείς, επιδιώκοντας πάντα να αποκαλύψει συναρπαστικές και συναρπαστικές ιστορίες. Η Agne είναι κάτοχος πτυχίου στη λογοτεχνία και έχει εκτεταμένο υπόβαθρο γραφής για ένα ευρύ φάσμα θεμάτων, όπως ταξίδια, τέχνη και πολιτισμός. Έχει επίσης εργαστεί εθελοντικά ως συντάκτρια για την οργάνωση για τα δικαιώματα των ζώων, όπου βοήθησε στην ευαισθητοποίηση σχετικά με θέματα καλής διαβίωσης των ζώων. Επικοινωνήστε μαζί της [προστασία μέσω email].

Περισσότερα άρθρα
Agne Cimerman
Agne Cimerman

Η Agne είναι μια δημοσιογράφος που καλύπτει τις τελευταίες τάσεις και εξελίξεις στο metaverse, AI και Web3 βιομηχανίες για την Metaverse Post. Το πάθος της για την αφήγηση την οδήγησε να πραγματοποιήσει πολυάριθμες συνεντεύξεις με ειδικούς σε αυτούς τους τομείς, επιδιώκοντας πάντα να αποκαλύψει συναρπαστικές και συναρπαστικές ιστορίες. Η Agne είναι κάτοχος πτυχίου στη λογοτεχνία και έχει εκτεταμένο υπόβαθρο γραφής για ένα ευρύ φάσμα θεμάτων, όπως ταξίδια, τέχνη και πολιτισμός. Έχει επίσης εργαστεί εθελοντικά ως συντάκτρια για την οργάνωση για τα δικαιώματα των ζώων, όπου βοήθησε στην ευαισθητοποίηση σχετικά με θέματα καλής διαβίωσης των ζώων. Επικοινωνήστε μαζί της [προστασία μέσω email].

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταία νέα

Η θεσμική όρεξη αυξάνεται προς τα ETF του Bitcoin εν μέσω αστάθειας

Οι αποκαλύψεις μέσω των καταθέσεων 13F αποκαλύπτουν αξιόλογους θεσμικούς επενδυτές που ασχολούνται με τα Bitcoin ETF, υπογραμμίζοντας την αυξανόμενη αποδοχή του ...

Μάθετε περισσότερα

Έφτασε η ημέρα της ποινής: Η μοίρα της CZ βρίσκεται σε ισορροπία καθώς το δικαστήριο των ΗΠΑ εξετάζει την ένσταση του DOJ

Ο Changpeng Zhao είναι έτοιμος να αντιμετωπίσει την καταδίκη σε αμερικανικό δικαστήριο στο Σιάτλ σήμερα.

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Δείτε Περισσότερα
Διάβασε περισσότερα
Το Injective ενώνει τις δυνάμεις του με το AltLayer για να επαναφέρει την ασφάλεια στο inEVM
Business Αναφορά ειδήσεων Τεχνολογία
Το Injective ενώνει τις δυνάμεις του με το AltLayer για να επαναφέρει την ασφάλεια στο inEVM
3 Μαΐου 2024
Η Masa συνεργάζεται με το Teller για να εισαγάγει το MASA Lending Pool, ενεργοποιεί τον βασικό δανεισμό USDC
αγορές Αναφορά ειδήσεων Τεχνολογία
Η Masa συνεργάζεται με το Teller για να εισαγάγει το MASA Lending Pool, ενεργοποιεί τον βασικό δανεισμό USDC
3 Μαΐου 2024
Η Velodrome κυκλοφορεί την έκδοση Superchain Beta τις επόμενες εβδομάδες και επεκτείνεται σε όλες τις OP Stack Layer 2 Blockchains
αγορές Αναφορά ειδήσεων Τεχνολογία
Η Velodrome κυκλοφορεί την έκδοση Superchain Beta τις επόμενες εβδομάδες και επεκτείνεται σε όλες τις OP Stack Layer 2 Blockchains
3 Μαΐου 2024
Η CARV ανακοινώνει συνεργασία με την Aethir για την αποκέντρωση του επιπέδου δεδομένων της και τη διανομή ανταμοιβών
Business Αναφορά ειδήσεων Τεχνολογία
Η CARV ανακοινώνει συνεργασία με την Aethir για την αποκέντρωση του επιπέδου δεδομένων της και τη διανομή ανταμοιβών
3 Μαΐου 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.