Nyhetsrapport Teknologi
Mars 16, 2023

GPT-4 Ärver "hallucinerande" fakta och resonemangsfel från tidigare GPT Modeller

I korthet

OpenAI säger GPT-4 har liknande begränsningar som tidigare GPT modeller.

GPT-4 hallucinerar fortfarande fakta och gör resonemangsfel.

Emellertid GPT-4 får 40 % högre poäng än OpenAIär senast GPT-3.5 om företagets interna kontradiktoriska faktautvärderingar.

GPT-4 Ärver "hallucinerande" fakta och resonemangsfel från tidigare GPT Modeller

OpenAI har varnat användarna att dess senaste språkmodell, GPT-4, är fortfarande inte helt tillförlitlig och kan "hallucinera" fakta och göra resonemangsfel. Företaget uppmanar användarna att vara försiktiga när de använder språkmodeller, särskilt i "höga insatser".

Men den goda nyheten är att GPT-4 minskar hallucinationer avsevärt jämfört med tidigare modeller. OpenAI påstår att GPT-4 får 40 % högre poäng än den senaste GPT-3.5 om interna kontradiktoriska faktabedömningar. 

via OpenAI

"Vi har gjort framsteg med externa riktmärken som TruthfulQA, som testar modellens förmåga att skilja fakta från en motstridigt utvald uppsättning felaktiga påståenden. Dessa frågor är parade med faktiskt felaktiga svar som är statistiskt tilltalande.” OpenAI skrev i en blogginlägg.

Trots denna förbättring saknar modellen fortfarande kunskap om händelser som inträffade efter september 2021 och gör ibland enkla resonemangsfel, precis som tidigare modeller gör. Dessutom kan den vara alltför godtrogen när det gäller att acceptera uppenbara falska uttalanden från användare och misslyckas med svåra problem, som att införa säkerhetsbrister i sin kod. Den faktakontrollerar inte heller informationen den tillhandahåller.

Liksom sina föregångare, GPT-4 kan generera skadliga råd, buggykod eller felaktig information. Modellens ytterligare möjligheter leder dock till nya riskytor som behöver förstås. För att bedöma omfattningen av dessa risker, över 50 experter från olika domäner, inklusive AI-anpassningsrisker, cybersäkerhet, biorisk, förtroende och säkerhet och internationell säkerhet, engagerades för att testa modellen. Deras feedback och data användes sedan för att förbättra modellen, som att samla in ytterligare data för att förbättra GPT-4s förmåga att avslå förfrågningar om hur man syntetiserar farliga kemikalier.

Ett av de viktigaste sätten OpenAI minskar skadliga uteffekter är genom att införliva en extra säkerhetsbelöningssignal under RLHF-träning (Reinforcement Learning from Human Feedback). Signalen tränar modellen att avslå förfrågningar om skadligt innehåll, som defined av modellens riktlinjer för användning. Belöningen tillhandahålls av en GPT-4 nollskottsklassificerare, som bedömer säkerhetsgränser och färdigställandestil på säkerhetsrelaterade uppmaningar.

OpenAI sa också att den hade minskat modellens tendens att svara på förfrågningar om otillåtet innehåll med 82 % jämfört med GPT-3.5 och GPT-4 svarar 29 % oftare på känsliga förfrågningar som medicinsk rådgivning och självskada i enlighet med företagets policyer.

via OpenAI

Medan OpenAIs interventioner har ökat svårigheten att framkalla dåligt beteende från GPT-4, det är fortfarande möjligt, och det finns fortfarande jailbreaks som kan generera innehåll som bryter mot riktlinjerna för användning. 

"I takt med att AI-system blir mer utbredda kommer det att bli allt viktigare att uppnå en hög grad av tillförlitlighet i dessa interventioner. För nu är det viktigt att komplettera dessa begränsningar med säkerhetstekniker under driftsättning som övervakning av missbruk”, tillade företaget.

OpenAI samarbetar med externa forskare för att bättre förstå och bedöma de potentiella effekterna av GPT-4 och dess efterföljande modeller. Teamet utvecklar också utvärderingar för farliga funktioner som kan dyka upp i framtida AI-system. När de fortsätter att studera potentiella sociala och ekonomiska effekter of GPT-4 och andra AI-system, OpenAI kommer att dela sina resultat och insikter med allmänheten i god tid.

Läs mer:

Taggar:

Villkor

I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.

Om författaren

Cindy är journalist på Metaverse Post, som täcker ämnen relaterade till web3, NFT, metaverse och AI, med fokus på intervjuer med Web3 branschaktörer. Hon har pratat med över 30 chefer på C-nivå och har gett sina värdefulla insikter till läsarna. Cindy kommer ursprungligen från Singapore och är nu baserad i Tbilisi, Georgia. Hon har en kandidatexamen i kommunikations- och mediestudier från University of South Australia och har ett decenniums erfarenhet av journalistik och skrivande. Ta kontakt med henne via [e-postskyddad] med presstitlar, tillkännagivanden och intervjutillfällen.

fler artiklar
Cindy Tan
Cindy Tan

Cindy är journalist på Metaverse Post, som täcker ämnen relaterade till web3, NFT, metaverse och AI, med fokus på intervjuer med Web3 branschaktörer. Hon har pratat med över 30 chefer på C-nivå och har gett sina värdefulla insikter till läsarna. Cindy kommer ursprungligen från Singapore och är nu baserad i Tbilisi, Georgia. Hon har en kandidatexamen i kommunikations- och mediestudier från University of South Australia och har ett decenniums erfarenhet av journalistik och skrivande. Ta kontakt med henne via [e-postskyddad] med presstitlar, tillkännagivanden och intervjutillfällen.

Hot Stories
Gå med i vårt nyhetsbrev.
Senaste nytt

DOGE Frenzy: Analysera Dogecoins (DOGE) senaste ökning i värde

Kryptovalutaindustrin expanderar snabbt, och meme-mynt förbereder sig för en betydande uppgång. Dogecoin (DOGE), ...

Lär dig mer

Utvecklingen av AI-genererat innehåll i metaversen

Framväxten av generativt AI-innehåll är en av de mest fascinerande utvecklingarna i den virtuella miljön ...

Lär dig mer
Gå med i vår innovativa teknikgemenskap
Läs mer
Läs mer
Scroll slutför Bernoulli Mainnet-uppgradering, räknar med 10x minskning av transaktionskostnader
Nyhetsrapport Teknologi
Scroll slutför Bernoulli Mainnet-uppgradering, räknar med 10x minskning av transaktionskostnader
29 april 2024
OKX Jumpstart listar Runecoin, gör det möjligt för BTC-insatser att tjäna RUNE-tokens
Marknader Nyhetsrapport Teknologi
OKX Jumpstart listar Runecoin, gör det möjligt för BTC-insatser att tjäna RUNE-tokens
29 april 2024
Veckans bästa erbjudanden, stora investeringar i AI, IT, Web3, och Crypto (22-26.04)
Smälta Företag Marknader Teknologi
Veckans bästa erbjudanden, stora investeringar i AI, IT, Web3, och Crypto (22-26.04)
26 april 2024
Vitalik Buterin kommenterar centralisering av PoW, noterar att det var ett tillfälligt skede tills PoS
Nyhetsrapport Teknologi
Vitalik Buterin kommenterar centralisering av PoW, noterar att det var ett tillfälligt skede tills PoS
26 april 2024