Buletin de stiri Tehnologia
Martie 15, 2023

OpenAI Reunește o echipă de peste 50 de experți pentru a îmbunătăți GPT-4Siguranța lui

Pe scurt

OpenAI a angajat o echipă de peste 50 de experți pentru a se asigura că este cel mai nou model de limbaj, GPT-4, este sigur pentru utilizare.

Echipa include cercetători și ingineri specializați în siguranță, etică și politică AI.

Scopul este prevenirea GPT-4 de la generarea de conținut dăunător sau părtinitor și să se asigure că acesta se aliniază cu valorile umane.

OpenAI Reunește o echipă de peste 50 de experți pentru a îmbunătăți GPT-4Siguranța lui

OpenAI a angajat peste 50 de experți din diverse domenii pentru a face GPT-4 mai sigur. Experții au lucrat cu testarea contradictorie a modelului pentru a identifica potențiale riscuri și vulnerabilități. Sunt experți din diverse domenii: riscuri pe termen lung de aliniere a IA, securitate cibernetică, risc biologic și securitate internațională. Descoperirile lor au ajutat OpenAI evaluează comportamentul modelului în zonele cu risc ridicat care necesită expertiză de nișă. 

În timp ce cel mai nou model de limbă prezintă riscuri similare cu modelele de limbă mai mici, capacitățile suplimentare ale GPT-4 duce la noi amenințări. Astfel, angajarea experților a fost crucial în asigurarea siguranței tehnologiei.

OpenAI a implementat un set suplimentar de instrucțiuni de instruire și modele de recompensă bazate pe reguli (RBRM) relevante pentru siguranță pentru a îmbunătăți siguranța GPT-4 model. RBRM-urile sunt zero-shot GPT-4 clasificatoare care funcționează ca un semnal suplimentar de recompensă pentru GPT-4 model de politică în timpul reglajului RLHF. Scopul lor este de a stimula un comportament adecvat, cum ar fi refuzul de a genera conținut dăunător sau nu respingerea cererilor inofensive.

Pentru a asigura siguranța GPT-4 modele, OpenAI a început să recruteze experți externi în august 2022 pentru a desfășura exerciții de „echipă roșie”, inclusiv teste de stres, testare la limită și testare contradictorie. Au avut acces la versiunile timpurii ale GPT-4 model și a identificat riscurile inițiale care au motivat cercetări ulterioare în materie de siguranță.

Feedbackul experților a condus la atenuări tehnice și la măsuri de aplicare a politicilor pentru a reduce riscurile. Cu toate acestea, rămân multe amenințări și este nevoie de o evaluare suplimentară.

Vorbind despre angajații de la OpenAI, ChatGPT a fost inițial dezvoltat cu ajutorul unor indivizi din unele dintre cele mai sărace regiuni ale lumii prin OpenAIparteneriatul lui cu o companie numită Sama, care angajează milioane de muncitori din zone sărace. Unii experți în etica AI au criticat OpenAIdecizia lui de a externaliza formarea sa ChatGPT model lui Sama, acuzând compania că exploatează forța de muncă la preț redus.

Citeşte mai mult:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Agne este o jurnalistă care acoperă cele mai recente tendințe și evoluții în metaverse, AI și Web3 industrii pentru Metaverse Post. Pasiunea ei pentru povestire a determinat-o să conducă numeroase interviuri cu experți în aceste domenii, căutând mereu să descopere povești interesante și captivante. Agne deține o diplomă de licență în literatură și are o experiență vastă în scris despre o gamă largă de subiecte, inclusiv călătorii, artă și cultură. De asemenea, s-a oferit voluntar ca editor pentru organizația pentru drepturile animalelor, unde a contribuit la creșterea gradului de conștientizare cu privire la problemele de bunăstare a animalelor. Contactează-o pe [e-mail protejat].

Mai multe articole
Agne Cimerman
Agne Cimerman

Agne este o jurnalistă care acoperă cele mai recente tendințe și evoluții în metaverse, AI și Web3 industrii pentru Metaverse Post. Pasiunea ei pentru povestire a determinat-o să conducă numeroase interviuri cu experți în aceste domenii, căutând mereu să descopere povești interesante și captivante. Agne deține o diplomă de licență în literatură și are o experiență vastă în scris despre o gamă largă de subiecte, inclusiv călătorii, artă și cultură. De asemenea, s-a oferit voluntar ca editor pentru organizația pentru drepturile animalelor, unde a contribuit la creșterea gradului de conștientizare cu privire la problemele de bunăstare a animalelor. Contactează-o pe [e-mail protejat].

Apetitul instituțional crește față de ETF-urile Bitcoin pe fondul volatilității

Dezvăluirile prin dosarele 13F dezvăluie investitori instituționali de seamă care se amestecă în ETF-uri Bitcoin, subliniind o acceptare tot mai mare a...

Aflați mai multe

Sosește ziua sentinței: soarta lui CZ este în echilibru, în timp ce tribunalul american ia în considerare pledoaria DOJ

Changpeng Zhao este pe cale de a fi condamnat astăzi într-un tribunal american din Seattle.

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Injective își unește forțele cu AltLayer pentru a aduce securitatea refacerii în EVM
Afaceri Buletin de stiri Tehnologia
Injective își unește forțele cu AltLayer pentru a aduce securitatea refacerii în EVM
3 Mai, 2024
Masa face echipă cu Teller pentru a introduce grupul de împrumuturi MASA, care permite împrumuturile USDC pe bază
pieţe Buletin de stiri Tehnologia
Masa face echipă cu Teller pentru a introduce grupul de împrumuturi MASA, care permite împrumuturile USDC pe bază
3 Mai, 2024
Velodrome lansează versiunea Beta a Superchain în săptămânile următoare și se extinde în blockchainurile OP Stack Layer 2
pieţe Buletin de stiri Tehnologia
Velodrome lansează versiunea Beta a Superchain în săptămânile următoare și se extinde în blockchainurile OP Stack Layer 2
3 Mai, 2024
CARV anunță parteneriat cu Aethir pentru a-și descentraliza stratul de date și a distribui recompense
Afaceri Buletin de stiri Tehnologia
CARV anunță parteneriat cu Aethir pentru a-și descentraliza stratul de date și a distribui recompense
3 Mai, 2024
CRYPTOMERIA LABS PTE. LTD.