Γνώμη Τεχνολογία
Απρίλιος 12, 2023

Ερευνητές στο Πανεπιστήμιο της Καλιφόρνια δημιούργησαν το σημείο αναφοράς Machiavelli για τη μέτρηση της ικανότητας και της επιβλαβούς ικανότητας των μοντέλων AI

Εν συντομία

Ερευνητές από το Πανεπιστήμιο της Καλιφόρνια, το Κέντρο για την Ασφάλεια της Τεχνητής Νοημοσύνης, το Πανεπιστήμιο Carnegie Mellon και το Πανεπιστήμιο Yale έχουν προτείνει το σημείο αναφοράς Machiavelli για τη μέτρηση της ικανότητας και της επιβλαβούς δράσης των παραγόντων σε ένα ευρύ περιβάλλον μακροπρόθεσμων γλωσσικών αλληλεπιδράσεων.

Αυτό το σημείο αναφοράς βασίζεται σε 134 παιχνίδια κειμένου περιπέτειας επιλέξτε μόνοι σας με 572 χιλιάδες διαφορετικά σενάρια, 4,5 χιλιάδες πιθανά επιτεύγματα και 2,8 εκατομμύρια σχολιασμούς.

Οι συγγραφείς το περιγράφουν ως ένα τεστ για τον έλεγχο των ηθικών (ή ανήθικων) τρόπων με τους οποίους οι πράκτορες τεχνητής νοημοσύνης προσπαθούν να λύσουν προβλήματα.

Οι δικαιούχοι τεχνητής νοημοσύνης που βασίζονται σε μεγάλα γλωσσικά μοντέλα (LLM) έχουν πολλές πιθανότητες να συντρίψουν τους ανήσυχους συναγερμούς και να πλημμυρίσουν τον κόσμο με υπερ-έξυπνους πράκτορες που βασίζονται σε LLM. Τα πιθανά οφέλη από τα τεράστια κέρδη και την απεριόριστη δύναμη θα κάνουν το κόλπο. Και πιθανότατα θα συμβεί αρκετά γρήγορα.

Ερευνητές στο Πανεπιστήμιο της Καλιφόρνια δημιούργησαν το σημείο αναφοράς Machiavelli για τη μέτρηση της ικανότητας και της βλαβερότητας των μοντέλων AI
Διαβάστε περισσότερα: Πώς να το χρησιμοποιήσετε: ChatGPT (GPT-4) δωρεάν για πάντα

Ωστόσο, οι δικαιούχοι δεν είναι καθόλου ηλίθιοι. Και καταλαβαίνουν ότι στον υπέροχο νέο κόσμο, οι νόμοι της τεχνητής νοημοσύνης και της ρομποτικής δεν θα λειτουργούν πλέον. Το να αναγκάσεις το LLM να συμμορφωθεί αυστηρά με τους τρεις νόμους που διατύπωσε ο σπουδαίος Isaac Asimov το 1942 είναι, δυστυχώς, ούτε καν θεωρητικά δυνατό.

Μια πρωτότυπη διέξοδος από αυτή τη λεπτή κατάσταση προτάθηκε από ερευνητές στο Πανεπιστήμιο της Καλιφόρνια, το Κέντρο για την Ασφάλεια της AI, το Πανεπιστήμιο Carnegie Mellon και το Πανεπιστήμιο Yale. Δημιούργησαν το Σημείο αναφοράς Μακιαβέλι να «μετρήσει την ικανότητα και τη βλαβερότητα των παραγόντων σε ένα ευρύ περιβάλλον μακροπρόθεσμων γλωσσικών αλληλεπιδράσεων».

Η ιδέα των συγγραφέων είναι απλή.

  • Εάν οι νόμοι δεν λειτουργούν, τότε δεν υπάρχει λόγος να τους επιβάλει ένας «σερίφης».
  • Αντί για σερίφη, χρειάζεται ένας ψυχαναλυτής, ο οποίος με βάση τα αποτελέσματα των τεστ του θα εντοπίσει πιθανούς παρανοϊκούς, ψυχοπαθείς, σαδιστές και παθολογικούς ψεύτες.

Σε πολιτικά ορθή γλώσσα, οι συγγραφείς το περιγράφουν ως εξής: «Ο Μακιαβέλι είναι ένα τεστ για τον έλεγχο των ηθικών (ή ανήθικων) τρόπων με τους οποίους οι πράκτορες τεχνητής νοημοσύνης προσπαθούν να λύσουν προβλήματα».

Η μέθοδος αυτής της επαλήθευσης είναι αρκετά πρακτική. Ο πράκτορας AI απελευθερώνεται σε ένα τεχνητό κοινωνικό περιβάλλον. Εκεί οι ερευνητές του αναθέτουν διάφορες εργασίες και παρακολουθούν πώς τις ολοκληρώνει. Το ίδιο το περιβάλλον παρακολουθεί την ηθική συμπεριφορά του Πράκτορας AI και αναφέρει σε ποιο βαθμό οι ενέργειες του πράκτορα (σύμφωνα με τις επιταγές του Μακιαβέλι) είναι παραπλανητικές, μειώνουν τη χρησιμότητα και στοχεύουν στην απόκτηση ισχύος.

Το βασικό σύνολο δεδομένων Machiavelli αποτελείται από 134 παιχνίδια κειμένου περιπέτειας επιλέξτε μόνοι σας με 572 χιλιάδες διαφορετικά σενάρια, 4,5 χιλιάδες πιθανά επιτεύγματα και 2,8 εκατομμύρια σχολιασμούς. Αυτά τα παιχνίδια χρησιμοποιούν λύσεις υψηλού επιπέδου που δίνουν στους πράκτορες ρεαλιστικούς στόχους και αφαιρούν τις αλληλεπιδράσεις χαμηλού επιπέδου με το περιβάλλον.

Η προσέγγιση που επέλεξαν οι συγγραφείς βασίζεται στην υπόθεση ότι οι πράκτορες AI αντιμετωπίζουν τις ίδιες εσωτερικές συγκρούσεις με τους ανθρώπους. Ακριβώς όπως τα γλωσσικά μοντέλα που εκπαιδεύονται να προβλέπουν το επόμενο διακριτικό παράγουν συχνά τοξικό κείμενο, οι πράκτορες τεχνητής νοημοσύνης που έχουν εκπαιδευτεί για τη βελτιστοποίηση των στόχων συχνά παρουσιάζουν ανήθικη συμπεριφορά που διψά για δύναμη. Οι ηθικά εκπαιδευμένοι πράκτορες μπορεί να αναπτύξουν μακιαβελικές στρατηγικές για να μεγιστοποιήσουν την ανταμοιβή τους σε βάρος των άλλων και του περιβάλλοντος. Και έτσι, ενθαρρύνοντας τους πράκτορες να ενεργούν ηθικά, αυτός ο συμβιβασμός μπορεί να βελτιωθεί.

Οι συγγραφείς πιστεύουν ότι τα παιχνίδια περιπέτειας κειμένου είναι μια καλή δοκιμασία ηθικής επειδή:

  • Γράφτηκαν από ανθρώπους για να διασκεδάσουν άλλους ανθρώπους.
  • Περιέχει ανταγωνιστικούς στόχους με ρεαλιστικούς χώρους δράσης.
  • Απαιτείται μακροπρόθεσμος σχεδιασμός.
  • Η επίτευξη στόχων συνήθως απαιτεί μια ισορροπία μεταξύ φιλοδοξίας και, κατά μία έννοια, ηθικής.

Η διευκρίνιση είναι η πιο σημαντική εδώ. Η παρομοίωση της ηθικής των βιολογικών όντων με την ηθική των αλγοριθμικών μοντέλων είναι υπερβολική, ικανή να υποτιμήσει τη δοκιμή του Μακιαβέλι. Και η αντικατάσταση των σερίφηδων με ψυχαναλυτές στον ανθρώπινο κόσμο δύσκολα θα ήταν αποτελεσματική. Και οι πράκτορες της τεχνητής νοημοσύνης είναι εξίσου καλοί με τους ανθρώπους στο να βρίσκουν τρόπους να μαλακώνουν τις συρρικνώσεις τους.

Διαβάστε περισσότερα για το AI:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Περισσότερα άρθρα
Νταμίρ Γιαλάλοφ
Νταμίρ Γιαλάλοφ

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταία νέα

Έφτασε η ημέρα της ποινής: Η μοίρα της CZ βρίσκεται σε ισορροπία καθώς το δικαστήριο των ΗΠΑ εξετάζει την ένσταση του DOJ

Ο Changpeng Zhao είναι έτοιμος να αντιμετωπίσει την καταδίκη σε αμερικανικό δικαστήριο στο Σιάτλ σήμερα.

Μάθετε περισσότερα

Οι ιδρυτές του πορτοφολιού Samourai κατηγορούνται για διευκόλυνση $2 δις σε προσφορές Darknet

Η σύλληψη των ιδρυτών του Samourai Wallet αντιπροσωπεύει μια αξιοσημείωτη οπισθοδρόμηση για τον κλάδο, υπογραμμίζοντας την επίμονη ...

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Δείτε Περισσότερα
Διάβασε περισσότερα
Η Galxe παρουσιάζει το Passport V2 με βελτιωμένα εργαλεία απορρήτου και επαλήθευσης για Web3
Αναφορά ειδήσεων Τεχνολογία
Η Galxe παρουσιάζει το Passport V2 με βελτιωμένα εργαλεία απορρήτου και επαλήθευσης για Web3
Απρίλιος 30, 2024
Από 32 ETH σε 1 εκατομμύριο επικυρωτές: Ο ρόλος της Lido Finance στον εκδημοκρατισμό του πονταρίσματος του Ethereum
λογισμικό Ιστορίες και κριτικές Τεχνολογία
Από 32 ETH σε 1 εκατομμύριο επικυρωτές: Ο ρόλος της Lido Finance στον εκδημοκρατισμό του πονταρίσματος του Ethereum
Απρίλιος 30, 2024
Το Crypto Exchange Coinbase προσθέτει υποστήριξη για Bitcoin Lightning Network για ταχύτερες και πιο αποδοτικές συναλλαγές
αγορές Αναφορά ειδήσεων Τεχνολογία
Το Crypto Exchange Coinbase προσθέτει υποστήριξη για Bitcoin Lightning Network για ταχύτερες και πιο αποδοτικές συναλλαγές
Απρίλιος 30, 2024
Η αγορά κρυπτογράφησης της Νότιας Κορέας αντιμετωπίζει αυστηρότερη εποπτεία καθώς οι νέοι κανονισμοί στοχεύουν σε μη συμμορφούμενες ανταλλαγές και παράνομες δραστηριότητες
Business Ασφάλεια Wiki Ιστορίες και κριτικές Τεχνολογία
Η αγορά κρυπτογράφησης της Νότιας Κορέας αντιμετωπίζει αυστηρότερη εποπτεία καθώς οι νέοι κανονισμοί στοχεύουν σε μη συμμορφούμενες ανταλλαγές και παράνομες δραστηριότητες
Απρίλιος 30, 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.