Vijesti Tehnologija
Ožujak 16, 2023

GPT-4 Nasljeđuje "halucinantne" činjenice i pogreške u rezoniranju od ranije GPT Modeli

Ukratko

OpenAI kaže GPT-4 ima slična ograničenja kao ranije GPT modeli.

GPT-4 još uvijek halucinira činjenice i čini pogreške u rasuđivanju.

Međutim, GPT-4 rezultate 40% više od OpenAInajnoviji GPT-3.5 o internim kontradiktornim procjenama činjeničnosti tvrtke.

GPT-4 Nasljeđuje "halucinantne" činjenice i pogreške u rezoniranju od ranije GPT Modeli

OpenAI je upozorio korisnike da je njegov najnoviji jezični model, GPT-4, još uvijek nije u potpunosti pouzdan i može "halucinirati" činjenice i činiti pogreške u zaključivanju. Tvrtka poziva korisnike da budu oprezni pri korištenju izlaza jezičnog modela, posebno u "kontekstu s visokim ulozima".

Međutim, dobra vijest je ta GPT-4 značajno smanjuje halucinacije u odnosu na prethodne modele. OpenAI tvrdi da GPT-4 ima 40% više rezultate od posljednjeg GPT-3.5 o internim kontradiktornim procjenama činjeničnosti. 

preko OpenAI

“Postigli smo napredak na vanjskim mjerilima kao što je TruthfulQA, koji testira sposobnost modela da odvoji činjenice od kontradiktorno odabranog skupa netočnih izjava. Ova su pitanja uparena s činjenično netočnim odgovorima koji su statistički privlačni," OpenAI napisao u a blog post.

Unatoč ovom poboljšanju, modelu još uvijek nedostaju znanja o događajima koji su se dogodili nakon rujna 2021. i ponekad čini jednostavne pogreške u zaključivanju, baš kao i raniji modeli. Osim toga, može biti pretjerano lakovjeran u prihvaćanju očiglednih lažnih izjava korisnika i podbaciti u teškim problemima, kao što je uvođenje sigurnosnih propusta u svoj kod. Također ne provjerava činjenice koje pruža.

Kao i njegovi prethodnici, GPT-4 može generirati štetne savjete, buggy kod ili netočne informacije. Međutim, dodatne mogućnosti modela dovode do novih površina rizika koje je potrebno razumjeti. Da bi se procijenio opseg ovih rizika, preko 50 stručnjaka iz različitih domena, uključujući rizike usklađivanja umjetne inteligencije, kibernetičku sigurnost, biorizik, povjerenje i sigurnost te međunarodnu sigurnost, angažirani su za kontradiktorno testiranje modela. Njihove povratne informacije i podaci zatim su korišteni za poboljšanje modela, kao što je prikupljanje dodatnih podataka za poboljšanje GPT-4sposobnost da odbije zahtjeve o tome kako sintetizirati opasne kemikalije.

Jedan od glavnih načina OpenAI smanjenje štetnih učinaka je uključivanjem dodatnog signala sigurnosne nagrade tijekom RLHF (Reinforcement Learning from Human Feedback) obuke. Signal trenira model da odbija zahtjeve za štetnim sadržajem, kao defiu skladu sa smjernicama za korištenje modela. Nagradu osigurava a GPT-4 zero-shot klasifikator, koji procjenjuje sigurnosne granice i stil završetka na upitima koji se odnose na sigurnost.

OpenAI također je rekao da je smanjio tendenciju modela da odgovori na zahtjeve za nedopuštenim sadržajem za 82% u usporedbi s GPT-3.5 i GPT-4 29% češće odgovara na osjetljive zahtjeve kao što su medicinski savjeti i samoozljeđivanje u skladu s politikom tvrtke.

preko OpenAI

Dok OpenAINjegove intervencije su povećale poteškoće u izazivanju lošeg ponašanja od GPT-4, još uvijek je moguće i još uvijek postoje jailbreakovi koji mogu generirati sadržaj koji krši smjernice za korištenje. 

“Kako sustavi umjetne inteligencije postaju sve rašireniji, postizanje visokog stupnja pouzdanosti u ovim intervencijama postat će sve kritičnije. Za sada je ključno nadopuniti ova ograničenja sigurnosnim tehnikama tijekom postavljanja kao što je praćenje zlouporabe,” dodala je tvrtka.

OpenAI surađuje s vanjskim istraživačima kako bi bolje razumio i procijenio potencijalne učinke GPT-4 i njegovi modeli nasljednici. Tim također razvija procjene opasnih sposobnosti koje bi se mogle pojaviti u budućim AI sustavima. Dok nastavljaju proučavati potencijalne društvene i ekonomski učinci of GPT-4 i drugi AI sustavi, OpenAI svoje će nalaze i uvide pravodobno podijeliti s javnošću.

Pročitajte više:

Oznake:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Cindy je novinarka u Metaverse Post, pokrivajući teme povezane s web3, NFT, metaverse i AI, s fokusom na intervjue s Web3 igrači u industriji. Razgovarala je s više od 30 rukovoditelja na razini C i sve više, donoseći njihove dragocjene uvide čitateljima. Porijeklom iz Singapura, Cindy sada živi u Tbilisiju u Gruziji. Diplomirala je komunikacije i medijske studije na Sveučilištu Južne Australije i ima desetljeće iskustva u novinarstvu i pisanju. Stupite u kontakt s njom putem [e-pošta zaštićena] s predstavljanjima za novinare, najavama i prilikama za intervjue.

Više članaka
Cindy Tan
Cindy Tan

Cindy je novinarka u Metaverse Post, pokrivajući teme povezane s web3, NFT, metaverse i AI, s fokusom na intervjue s Web3 igrači u industriji. Razgovarala je s više od 30 rukovoditelja na razini C i sve više, donoseći njihove dragocjene uvide čitateljima. Porijeklom iz Singapura, Cindy sada živi u Tbilisiju u Gruziji. Diplomirala je komunikacije i medijske studije na Sveučilištu Južne Australije i ima desetljeće iskustva u novinarstvu i pisanju. Stupite u kontakt s njom putem [e-pošta zaštićena] s predstavljanjima za novinare, najavama i prilikama za intervjue.

Hot Stories
Pridružite se našem biltenu.
Najnovije vijesti

DOGE Frenzy: analiziranje nedavnog porasta vrijednosti Dogecoina (DOGE)

Industrija kriptovaluta brzo se širi, a meme kovanice se pripremaju za značajan uzlet. Dogecoin (DOGE), ...

Znati više

Evolucija sadržaja generiranog umjetnom inteligencijom u metaverzumu

Pojava generativnog AI sadržaja jedan je od najfascinantnijih razvoja unutar virtualnog okruženja...

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
Scroll dovršava Bernoulli Mainnet nadogradnju, predviđa desetostruko smanjenje transakcijskih troškova
Vijesti Tehnologija
Scroll dovršava Bernoulli Mainnet nadogradnju, predviđa desetostruko smanjenje transakcijskih troškova
Travnja 29, 2024
OKX Jumpstart navodi Runecoin, omogućuje BTC Staking za zaradu RUNE tokena
tržišta Vijesti Tehnologija
OKX Jumpstart navodi Runecoin, omogućuje BTC Staking za zaradu RUNE tokena
Travnja 29, 2024
Najbolje ponude ovog tjedna, velika ulaganja u AI, IT, Web3, i Crypto (22-26.04.)
probaviti posao tržišta Tehnologija
Najbolje ponude ovog tjedna, velika ulaganja u AI, IT, Web3, i Crypto (22-26.04.)
Travnja 26, 2024
Vitalik Buterin komentira centralizaciju PoW-a, napominje da je to bila privremena faza do PoS-a
Vijesti Tehnologija
Vitalik Buterin komentira centralizaciju PoW-a, napominje da je to bila privremena faza do PoS-a
Travnja 26, 2024
CRYPTOMERIA LABS PTE. LTD.