Ziņojums Tehnoloģija
Marts 16, 2023

GPT-4 Pārmanto “halucinējošus” faktus un pamatojuma kļūdas no agrāk GPT Modeļi

Īsumā

OpenAI saka GPT-4 ir līdzīgi ierobežojumi kā iepriekš GPT modeļi.

GPT-4 joprojām halucinē faktus un pieļauj argumentācijas kļūdas.

Tomēr, GPT-4 punktu skaits ir par 40% augstāks nekā OpenAIir jaunākais GPT-3.5 par uzņēmuma iekšējiem pretrunīguma faktu novērtējumiem.

GPT-4 Pārmanto "halucinējošus" faktus un pamatojuma kļūdas no agrākiem laikiem GPT Modeļi

OpenAI ir brīdinājis lietotājus, ka tā jaunākais valodas modelis, GPT-4, joprojām nav pilnībā uzticams un var “halucinēt” faktus un pieļaut argumentācijas kļūdas. Uzņēmums mudina lietotājus ievērot piesardzību, izmantojot valodas modeļa rezultātus, jo īpaši “augstu likmju kontekstos”.

Tomēr labā ziņa ir tā GPT-4 ievērojami samazina halucinācijas salīdzinājumā ar iepriekšējiem modeļiem. OpenAI apgalvo, ka GPT-4 punktu skaits ir par 40% augstāks nekā jaunākais GPT-3.5 par iekšējiem pretrunīguma faktu novērtējumiem. 

līdz OpenAI

“Mēs esam panākuši progresu ārējos etalonos, piemēram, TruthfulQA, kas pārbauda modeļa spēju nošķirt faktus no pretinieku izvēlētas nepareizu apgalvojumu kopas. Šie jautājumi ir saistīti ar faktiski nepareizām atbildēm, kas ir statistiski pievilcīgas. OpenAI rakstīja a blog post.

Neskatoties uz šo uzlabojumu, modelim joprojām trūkst zināšanu par notikumiem, kas notikuši pēc 2021. gada septembra, un dažreiz tas pieļauj vienkāršas argumentācijas kļūdas, tāpat kā iepriekšējos modeļos. Turklāt tas var būt pārāk lētticīgs, pieņemot acīmredzamus nepatiesus paziņojumus no lietotājiem, un nespēj atrisināt nopietnas problēmas, piemēram, ieviešot savā kodā drošības ievainojamības. Tā arī nepārbauda sniegto informāciju.

Tāpat kā tās priekšgājēji, GPT-4 var radīt kaitīgus padomus, kļūdainu kodu vai neprecīzu informāciju. Tomēr modeļa papildu iespējas rada jaunas riska virsmas, kas ir jāsaprot. Lai novērtētu šo risku apmēru, vairāk nekā 50 ekspertu No dažādām jomām, tostarp AI saskaņošanas riskiem, kiberdrošības, bioriska, uzticamības un starptautiskās drošības, tika iesaistīti, lai pārbaudītu modeli pretrunīgi. Viņu atsauksmes un dati tika izmantoti, lai uzlabotu modeli, piemēram, apkopotu papildu datus, lai uzlabotu GPT-4spēja noraidīt pieprasījumus par bīstamu ķīmisko vielu sintezēšanu.

Viens no galvenajiem veidiem OpenAI kaitīgo izlaidumu samazināšana tiek veikta, iekļaujot papildu drošības atlīdzības signālu RLHF (Pastiprināšanas mācīšanās no cilvēka atgriezeniskās saites) apmācības laikā. Signāls apmāca modeli atteikt pieprasījumus par kaitīgu saturu, kā defisaskaņā ar modeļa lietošanas vadlīnijām. Atlīdzību nodrošina a GPT-4 nulles šāviena klasifikators, kas nosaka drošības robežas un pabeigšanas stilu pēc ar drošību saistītajiem norādījumiem.

OpenAI arī teica, ka tas ir samazinājis modeļa tendenci atbildēt uz neatļauta satura pieprasījumiem par 82%, salīdzinot ar GPT-3.5 un GPT-4 par 29% biežāk atbild uz sensitīviem pieprasījumiem, piemēram, medicīnisku padomu un paškaitējumu saskaņā ar uzņēmuma politiku.

līdz OpenAI

Kamēr OpenAI's iejaukšanās ir palielinājusi grūtības izraisīt sliktu uzvedību GPT-4, tas joprojām ir iespējams, un joprojām ir jailbreaks, kas var ģenerēt saturu, kas pārkāpj lietošanas vadlīnijas. 

“Tā kā mākslīgā intelekta sistēmas kļūst arvien izplatītākas, augstas uzticamības pakāpes sasniegšana šajās intervencēs kļūs arvien svarīgāka. Pagaidām ir svarīgi šos ierobežojumus papildināt ar izvietošanas laika drošības metodēm, piemēram, ļaunprātīgas izmantošanas uzraudzību, ”piebilda uzņēmums.

OpenAI sadarbojas ar ārējiem pētniekiem, lai labāk izprastu un novērtētu iespējamo ietekmi GPT-4 un tā pēcteču modeļiem. Komanda arī izstrādā novērtējumus par bīstamām iespējām, kas var parādīties turpmākajās AI sistēmās. Tā kā viņi turpina pētīt potenciālo sociālo un ekonomiskā ietekme of GPT-4 un citas AI sistēmas, OpenAI savos atklājumos un atziņās savlaicīgi dalīsies ar sabiedrību.

Lasīt vairāk:

Tags:

Atbildības noraidīšana

Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.

Par Autors

Sindija ir žurnāliste Metaverse Post, aptverot tēmas, kas saistītas ar web3, NFT, metaverse un AI, koncentrējoties uz intervijām ar Web3 nozares spēlētājiem. Viņa ir runājusi ar vairāk nekā 30 C līmeņa vadītājiem, sniedzot lasītājiem viņu vērtīgās atziņas. Sākotnēji no Singapūras, Sindija tagad atrodas Tbilisi, Džordžijas štatā. Viņai ir bakalaura grāds komunikāciju un mediju studijās Dienvidaustrālijas Universitātē, un viņai ir desmit gadu pieredze žurnālistikā un rakstniecībā. Sazinieties ar viņu, izmantojot [e-pasts aizsargāts] ar preses prezentācijām, paziņojumiem un interviju iespējām.

Vairāk rakstus
Sindija Tana
Sindija Tana

Sindija ir žurnāliste Metaverse Post, aptverot tēmas, kas saistītas ar web3, NFT, metaverse un AI, koncentrējoties uz intervijām ar Web3 nozares spēlētājiem. Viņa ir runājusi ar vairāk nekā 30 C līmeņa vadītājiem, sniedzot lasītājiem viņu vērtīgās atziņas. Sākotnēji no Singapūras, Sindija tagad atrodas Tbilisi, Džordžijas štatā. Viņai ir bakalaura grāds komunikāciju un mediju studijās Dienvidaustrālijas Universitātē, un viņai ir desmit gadu pieredze žurnālistikā un rakstniecībā. Sazinieties ar viņu, izmantojot [e-pasts aizsargāts] ar preses prezentācijām, paziņojumiem un interviju iespējām.

Hot Stories
Pievienojieties mūsu informatīvajam izdevumam.
Jaunākās ziņas

DOGE Frenzy: analizējot Dogecoin (DOGE) neseno vērtības pieaugumu

Kriptovalūtu industrija strauji paplašinās, un mēmu monētas gatavojas ievērojamam augšupejam. Dogecoin (DOGE), ...

Uzziniet vairāk

AI radītā satura evolūcija metaversā

Ģeneratīvā AI satura parādīšanās ir viens no aizraujošākajiem notikumiem virtuālajā vidē ...

Uzziniet vairāk
Pievienojieties mūsu novatoriskajai tehnoloģiju kopienai
Lasīt vairāk
Vairāk
OKX Jumpstart sarakstu Runecoin, ļauj BTC Staking, lai nopelnītu RUNE žetonus
Markets Ziņojums Tehnoloģija
OKX Jumpstart sarakstu Runecoin, ļauj BTC Staking, lai nopelnītu RUNE žetonus
Aprīlis 29, 2024
Šīs nedēļas labākie piedāvājumi, lielie ieguldījumi AI, IT, Web3un Kripto (22-26.04)
Sagremot bizness Markets Tehnoloģija
Šīs nedēļas labākie piedāvājumi, lielie ieguldījumi AI, IT, Web3un Kripto (22-26.04)
Aprīlis 26, 2024
Vitaliks Buterins komentē PoW centralizāciju, atzīmē, ka tas bija pagaidu posms līdz izlaidumam
Ziņojums Tehnoloģija
Vitaliks Buterins komentē PoW centralizāciju, atzīmē, ka tas bija pagaidu posms līdz izlaidumam
Aprīlis 26, 2024
Offchain Labs atklāj divas kritiskas ievainojamības Optimisma OP Stack krāpšanas pierādījumos
Ziņojums programmatūra Tehnoloģija
Offchain Labs atklāj divas kritiskas ievainojamības Optimisma OP Stack krāpšanas pierādījumos
Aprīlis 26, 2024
CRYPTOMERIA LABS PTE. LTD.