Märtsil 16, 2023

GPT-4 Pärib "hallutsineerivad" faktid ja arutlusvead varasemast GPT Mudelid

by Cindy Tan

Avaldatud: 16. märts 2023 kell 10:30 Värskendatud: 16. märts 2023 kell 10:30

Põgusalt

OpenAI ütleb GPT-4 on sarnased piirangud nagu varem GPT mudelid.

GPT-4 ikka hallutsineerib fakte ja teeb arutlusvigu.

Kuid GPT-4 hinded 40% kõrgemad kui OpenAIviimane GPT-3.5 ettevõttesisese võistleva faktihinnangu kohta.

GPT-4 Pärib "hallutsineerivad" faktid ja arutlusvead varasemast GPT Mudelid

OpenAI on kasutajaid hoiatanud, et tema uusim keelemudel, GPT-4, ei ole ikka veel täiesti usaldusväärne ja võib fakte "hallutsineerida" ja teha arutlusvigu. Ettevõte kutsub kasutajaid üles olema keelemudeli väljundite kasutamisel ettevaatlik, eriti "suurte panustega kontekstides".

Hea uudis on aga see GPT-4 vähendab oluliselt hallutsinatsioone võrreldes eelmiste mudelitega. OpenAI väidab seda GPT-4 hinded 40% kõrgemad kui viimastel GPT-3.5 sisemiste võistleva faktilisuse hindamiste kohta.

„Oleme teinud edusamme väliste võrdlusnäitajate osas, nagu TruthfulQA, mis testib mudeli võimet eraldada fakte võistlevalt valitud valede väidete hulgast. Need küsimused on seotud faktiliselt ebaõigete vastustega, mis on statistiliselt ahvatlevad. OpenAI kirjutas a blogi postitus.

Vaatamata sellele täiustusele puuduvad mudelil endiselt teadmised sündmustest, mis toimusid pärast 2021. aasta septembrit ja mõnikord tehakse lihtsaid arutlusvigu, nagu varasemad mudelid. Lisaks võib see olla liiga kergeusklik kasutajate ilmsete valeavalduste vastuvõtmisel ja ebaõnnestuda raskete probleemide lahendamisel, näiteks oma koodi turvaaukude lisamisel. Samuti ei kontrolli see pakutavat teavet faktide alusel.

Nagu tema eelkäijad, GPT-4 võib genereerida kahjulikke nõuandeid, vigast koodi või ebatäpset teavet. Mudeli lisavõimalused toovad aga kaasa uusi riskipindu, millest tuleb aru saada. Nende riskide ulatuse hindamiseks üle 50 eksperdi Mudeli vastastikku testimiseks kaasati erinevatest valdkondadest, sealhulgas tehisintellekti joondamise riskid, küberturvalisus, biorisk, usaldus ja turvalisus ning rahvusvaheline turvalisus. Nende tagasisidet ja andmeid kasutati seejärel mudeli täiustamiseks, näiteks koguti täiustamiseks täiendavaid andmeid GPT-4võime keelduda ohtlike kemikaalide sünteesimise taotlustest.

Üks peamisi viise OpenAI kahjulike väljundite vähendamiseks lisatakse RLHF (Inimtagasisidest õppimine) koolituse ajal täiendav ohutuspreemiasignaal. Signaal õpetab mudelit keelduma kahjuliku sisu taotlustest, nagu defimudeli kasutusjuhiste järgi. Preemia annab a GPT-4 nullkaadri klassifikaator, mis hindab ohutusega seotud viipade alusel ohutuspiire ja lõpetamisstiili.

OpenAI ütles ka, et see on vähendanud mudeli kalduvust vastata keelatud sisu päringutele 82% võrra võrreldes GPT-3.5 ja GPT-4 vastab tundlikele päringutele nagu arstiabi ja enesevigastamine vastavalt ettevõtte poliitikale 29% sagedamini.

Kui OpenAIsekkumine on suurendanud raskusi halva käitumise esilekutsumisel GPT-4, on see endiselt võimalik ja endiselt on jailbreake, mis võivad genereerida sisu, mis rikub kasutusjuhiseid.

"Kuna AI-süsteemid muutuvad levinumaks, muutub nende sekkumiste kõrge usaldusväärsuse saavutamine üha kriitilisemaks. Praegu on oluline täiendada neid piiranguid kasutuselevõtuaja ohutustehnikatega, nagu kuritarvitamise jälgimine, ”lisas ettevõte.

OpenAI teeb koostööd välisteadlastega, et paremini mõista ja hinnata võimalikke mõjusid GPT-4 ja selle järglaste mudelid. Samuti töötab meeskond välja hinnanguid tulevastes tehisintellektisüsteemides ilmneda võivate ohtlike võimaluste kohta. Kuna nad jätkavad potentsiaalsete sotsiaalsete ja majanduslikud mõjud of GPT-4 ja muud AI süsteemid, OpenAI jagavad oma leide ja teadmisi avalikkusega õigel ajal.

Loe rohkem:

Sildid:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Cindy on ajakirjanik Metaverse Post, mis käsitleb seotud teemasid web3, NFT, metaverse ja AI, keskendudes intervjuudele kasutajaga Web3 tööstuse mängijad. Ta on vestelnud enam kui 30 C-taseme juhiga, tuues lugejateni nende väärtuslikke teadmisi. Algselt Singapurist pärit Cindy asub nüüd Gruusias Thbilisis. Tal on Lõuna-Austraalia ülikoolis bakalaureusekraad kommunikatsiooni- ja meediauuringute alal ning tal on kümneaastane kogemus ajakirjanduses ja kirjutamises. Võtke temaga ühendust kaudu [meiliga kaitstud] pressikõnede, teadaannete ja intervjuuvõimalustega.

Veel artikleid

Cindy Tan