Buletin de stiri Tehnologia
Martie 16, 2023

GPT-4 Moștenește fapte „halucinante” și erori de raționament de mai devreme GPT modele

Pe scurt

OpenAI spune GPT-4 are limitări similare ca mai devreme GPT Modele.

GPT-4 halucinează în continuare fapte și comite erori de raționament.

"Dar daca GPT-4 scor cu 40% mai mare decât OpenAIcel mai recent GPT-3.5 privind evaluările contradictorii interne ale faptului companiei.

GPT-4 Moștenește fapte „halucinante” și erori de raționament de mai devreme GPT modele

OpenAI a avertizat utilizatorii că cel mai recent model de limbă, GPT-4, nu este încă pe deplin de încredere și poate „halucina” fapte și face erori de raționament. Compania îndeamnă utilizatorii să fie precauți atunci când folosesc rezultatele modelului lingvistic, în special în „contexte cu mize mari”.

Cu toate acestea, vestea bună este că GPT-4 reduce semnificativ halucinațiile față de modelele anterioare. OpenAI susține că GPT-4 scor cu 40% mai mare decât cel mai recent GPT-3.5 cu privire la evaluările contradictorii interne de fapt. 

de OpenAI

„Am făcut progrese în ceea ce privește criteriile de referință externe, cum ar fi TruthfulQA, care testează capacitatea modelului de a separa faptele de un set de afirmații incorecte selectate în mod advers. Aceste întrebări sunt asociate cu răspunsuri incorecte din punct de vedere faptic, care sunt atrăgătoare din punct de vedere statistic. OpenAI a scris într-un blog.

În ciuda acestei îmbunătățiri, modelul încă nu cunoaște evenimentele care au avut loc după septembrie 2021 și uneori face erori simple de raționament, la fel ca modelele anterioare. În plus, poate fi excesiv de credul în a accepta declarații false evidente de la utilizatori și poate eșua în probleme grele, cum ar fi introducerea unor vulnerabilități de securitate în codul său. De asemenea, nu verifică informațiile pe care le oferă.

Ca și predecesorii săi, GPT-4 poate genera sfaturi dăunătoare, coduri greșite sau informații inexacte. Cu toate acestea, capacitățile suplimentare ale modelului conduc la noi suprafețe de risc care trebuie înțelese. Pentru a evalua amploarea acestor riscuri, peste 50 de experți din diverse domenii, inclusiv riscurile de aliniere a AI, securitatea cibernetică, riscul biologic, încrederea și siguranța și securitatea internațională, au fost angajați pentru a testa modelul în mod advers. Feedback-ul și datele lor au fost apoi folosite pentru a îmbunătăți modelul, cum ar fi colectarea de date suplimentare pentru a îmbunătăți GPT-4capacitatea lui de a refuza cererile privind modul de sinteză a substanțelor chimice periculoase.

Una dintre căile principale OpenAI reducerea rezultatelor dăunătoare este prin încorporarea unui semnal suplimentar de recompensă de siguranță în timpul antrenamentului RLHF (Învățare de consolidare din feedback uman). Semnalul antrenează modelul să refuze solicitările de conținut dăunător, așa cum deficonform instrucțiunilor de utilizare ale modelului. Recompensa este oferită de a GPT-4 clasificator zero-shot, care judecă limitele de siguranță și stilul de completare pe indicații legate de siguranță.

OpenAI a mai spus că a scăzut tendința modelului de a răspunde la solicitările de conținut nepermis cu 82% față de GPT-3.5 și GPT-4 răspunde la solicitări sensibile, cum ar fi sfaturi medicale și autovătămare, în conformitate cu politicile companiei cu 29% mai des.

de OpenAI

In timp ce OpenAIintervențiile lui au crescut dificultatea de a provoca un comportament rău din GPT-4, este încă posibil și există încă jailbreak-uri care pot genera conținut care încalcă regulile de utilizare. 

„Pe măsură ce sistemele AI devin mai răspândite, atingerea unor grade ridicate de fiabilitate în aceste intervenții va deveni din ce în ce mai critică. Deocamdată, este esențial să completam aceste limitări cu tehnici de siguranță în timpul implementării, cum ar fi monitorizarea pentru abuz”, a adăugat compania.

OpenAI colaborează cu cercetători externi pentru a înțelege și a evalua mai bine impacturile potențiale ale GPT-4 și modelele sale succesoare. Echipa dezvoltă, de asemenea, evaluări pentru capabilitățile periculoase care pot apărea în viitoarele sisteme AI. Pe măsură ce ei continuă să studieze potențialul social și impactul economic of GPT-4 și alte sisteme AI, OpenAI își vor împărtăși publicul în timp util descoperirile și cunoștințele lor.

Citeşte mai mult:

Etichete:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Cindy este jurnalist la Metaverse Post, acoperind subiecte legate de web3, NFT, metavers și AI, cu accent pe interviuri cu Web3 jucători din industrie. Ea a vorbit cu peste 30 de directori de nivel C și nu mai mult, aducând cunoștințele lor valoroase cititorilor. Originară din Singapore, Cindy are acum sediul în Tbilisi, Georgia. Ea deține o diplomă de licență în Comunicații și Studii Media de la Universitatea din Australia de Sud și are un deceniu de experiență în jurnalism și scris. Luați legătura cu ea prin intermediul [e-mail protejat] cu prezentari de presă, anunțuri și oportunități de interviuri.

Mai multe articole
Cindy Tan
Cindy Tan

Cindy este jurnalist la Metaverse Post, acoperind subiecte legate de web3, NFT, metavers și AI, cu accent pe interviuri cu Web3 jucători din industrie. Ea a vorbit cu peste 30 de directori de nivel C și nu mai mult, aducând cunoștințele lor valoroase cititorilor. Originară din Singapore, Cindy are acum sediul în Tbilisi, Georgia. Ea deține o diplomă de licență în Comunicații și Studii Media de la Universitatea din Australia de Sud și are un deceniu de experiență în jurnalism și scris. Luați legătura cu ea prin intermediul [e-mail protejat] cu prezentari de presă, anunțuri și oportunități de interviuri.

Hot Stories
Alăturați-vă Newsletter-ului nostru.
Ultimele ştiri

Frenezia DOGE: Analizând creșterea recentă a valorii Dogecoin (DOGE).

Industria criptomonedelor se extinde rapid, iar monedele meme se pregătesc pentru o creștere semnificativă. Dogecoin (DOGE),...

Aflați mai multe

Evoluția conținutului generat de AI în metavers

Apariția conținutului AI generativ este una dintre cele mai fascinante dezvoltări din mediul virtual...

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Scroll finalizează upgrade-ul Bernoulli Mainnet, anticipează scăderea de 10 ori a costurilor de tranzacție
Buletin de stiri Tehnologia
Scroll finalizează upgrade-ul Bernoulli Mainnet, anticipează scăderea de 10 ori a costurilor de tranzacție
Aprilie 29, 2024
OKX Jumpstart listează Runecoin, permite miza BTC pentru a câștiga jetoane RUNE
pieţe Buletin de stiri Tehnologia
OKX Jumpstart listează Runecoin, permite miza BTC pentru a câștiga jetoane RUNE
Aprilie 29, 2024
Cele mai bune oferte din această săptămână, investiții majore în AI, IT, Web3și Crypto (22-26.04)
rezumat Afaceri pieţe Tehnologia
Cele mai bune oferte din această săptămână, investiții majore în AI, IT, Web3și Crypto (22-26.04)
Aprilie 26, 2024
Vitalik Buterin comentează despre centralizarea PoW, notează că a fost o etapă temporară până la PoS
Buletin de stiri Tehnologia
Vitalik Buterin comentează despre centralizarea PoW, notează că a fost o etapă temporară până la PoS
Aprilie 26, 2024
CRYPTOMERIA LABS PTE. LTD.