Novinky Technika
16. března 2023

GPT-4 Zdědí „halucinační“ fakta a chyby uvažování z dřívější doby GPT modely

Stručně

OpenAI říká GPT-4 má podobná omezení jako dříve GPT modely.

GPT-4 stále halucinuje fakta a dělá chyby v uvažování.

Nicméně, GPT-4 skóre o 40 % vyšší než OpenAInejnovější GPT-3.5 o interních kontradiktorních věcných hodnoceních společnosti.

GPT-4 Zdědí „halucinační“ fakta a chyby v uvažování z dřívější doby GPT modely

OpenAI varoval uživatele, že jeho nejnovější jazykový model, GPT-4, stále není plně spolehlivý a může „halucinovat“ fakta a dělat chyby v uvažování. Společnost naléhá na uživatele, aby byli opatrní při používání výstupů jazykových modelů, zejména v „kontextech s vysokými sázkami“.

Dobrá zpráva však je, že GPT-4 výrazně snižuje halucinace ve srovnání s předchozími modely. OpenAI tvrdí, že GPT-4 skóre o 40 % vyšší než nejnovější GPT-3.5 o interních kontradiktorních hodnoceních faktičnosti. 

přes OpenAI

„Dosáhli jsme pokroku v externích srovnávacích testech, jako je TruthfulQA, která testuje schopnost modelu oddělit fakta od nepřátelsky vybraného souboru nesprávných tvrzení. Tyto otázky jsou spojeny s fakticky nesprávnými odpověďmi, které jsou statisticky přitažlivé,“ OpenAI napsal v blogu.

Navzdory tomuto vylepšení model stále postrádá znalosti o událostech, které nastaly po září 2021, a někdy dělá jednoduché chyby v uvažování, stejně jako dřívější modely. Kromě toho může být příliš důvěřivý při přijímání zjevných nepravdivých prohlášení od uživatelů a selhat při vážných problémech, jako je zavádění bezpečnostních zranitelností do svého kódu. Rovněž neověřuje fakta informace, které poskytuje.

Stejně jako jeho předchůdci, GPT-4 může generovat škodlivé rady, chybný kód nebo nepřesné informace. Dodatečné možnosti modelu však vedou k novým rizikovým plochám, kterým je třeba porozumět. Chcete-li posoudit rozsah těchto rizik, přes 50 odborníků Z různých oblastí, včetně rizik přizpůsobení umělé inteligence, kybernetické bezpečnosti, biologického rizika, důvěry a bezpečnosti a mezinárodní bezpečnosti, byly zapojeny do nepříznivého testování modelu. Jejich zpětná vazba a data byly poté použity ke zlepšení modelu, jako je sběr dalších dat pro vylepšení GPT-4schopnost odmítnout požadavky na to, jak syntetizovat nebezpečné chemikálie.

Jeden z hlavních způsobů OpenAI snižuje škodlivé výstupy začleněním dodatečného signálu odměny za bezpečnost během školení RLHF (Reinforcement Learning from Human Feedback). Signál trénuje model k odmítnutí požadavků na škodlivý obsah, as defipodle pokynů pro použití modelu. Odměnu poskytuje a GPT-4 klasifikátor zero-shot, který posuzuje bezpečnostní hranice a styl dokončení na výzvách souvisejících s bezpečností.

OpenAI také uvedl, že snížil tendenci modelu reagovat na žádosti o nepovolený obsah o 82 % ve srovnání s GPT-3.5 a GPT-4 reaguje na citlivé požadavky, jako jsou lékařské rady a sebepoškozování v souladu se zásadami společnosti o 29 % častěji.

přes OpenAI

Zatímco OpenAIZásahy zvýšily obtížnost vyvolání špatného chování GPT-4, je to stále možné a stále existují útěky z vězení, které mohou generovat obsah porušující pokyny k použití. 

„S tím, jak se systémy umělé inteligence stávají stále rozšířenějšími, bude dosažení vysokého stupně spolehlivosti v těchto zásazích stále důležitější. Prozatím je nezbytné doplnit tato omezení bezpečnostními technikami v době nasazení, jako je monitorování zneužití,“ dodala společnost.

OpenAI spolupracuje s externími výzkumníky, aby lépe porozuměli a vyhodnotili potenciální dopady GPT-4 a jeho nástupnické modely. Tým také vyvíjí hodnocení nebezpečných schopností, které se mohou objevit v budoucích systémech umělé inteligence. Jak pokračují ve studiu potenciálních sociálních a ekonomické dopady of GPT-4 a další systémy AI, OpenAI budou včas sdílet své poznatky a poznatky s veřejností.

Čtěte více:

Tagy:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Cindy je novinářka v Metaverse Post, pokrývající témata související s web3, NFT, metaverse a AI, se zaměřením na rozhovory s Web3 hráči v oboru. Mluvila s více než 30 manažery na úrovni C a počítání a přinesla jejich cenné poznatky čtenářům. Cindy pochází ze Singapuru a nyní sídlí v Tbilisi v Gruzii. Je držitelkou bakalářského titulu v oboru komunikačních a mediálních studií na University of South Australia a má desetileté zkušenosti v žurnalistice a psaní. Spojte se s ní přes [chráněno e-mailem] s tiskovými nabídkami, oznámeními a příležitostmi k rozhovorům.

Další články
Cindy Tan
Cindy Tan

Cindy je novinářka v Metaverse Post, pokrývající témata související s web3, NFT, metaverse a AI, se zaměřením na rozhovory s Web3 hráči v oboru. Mluvila s více než 30 manažery na úrovni C a počítání a přinesla jejich cenné poznatky čtenářům. Cindy pochází ze Singapuru a nyní sídlí v Tbilisi v Gruzii. Je držitelkou bakalářského titulu v oboru komunikačních a mediálních studií na University of South Australia a má desetileté zkušenosti v žurnalistice a psaní. Spojte se s ní přes [chráněno e-mailem] s tiskovými nabídkami, oznámeními a příležitostmi k rozhovorům.

Hot Stories
Připojte se k našemu zpravodaji.
Novinky

The DOGE Frenzy: Analýza nedávného nárůstu hodnoty dogecoinu (DOGE).

Odvětví kryptoměn se rychle rozrůstá a meme coiny se připravují na výrazný vzestup. Dogecoin (DOGE),...

Vědět více

Vývoj obsahu generovaného umělou inteligencí v Metaverse

Vznik generativního obsahu umělé inteligence je jedním z nejvíce fascinujících pokroků ve virtuálním prostředí...

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Nejlepší nabídky tohoto týdne, velké investice do AI, IT, Web3a kryptoměny (22-26.04)
Strávit Business Trhy Technika
Nejlepší nabídky tohoto týdne, velké investice do AI, IT, Web3a kryptoměny (22-26.04)
26. dubna 2024
Vitalik Buterin komentuje centralizaci PoW a poznamenává, že to byla dočasná fáze do PoS
Novinky Technika
Vitalik Buterin komentuje centralizaci PoW a poznamenává, že to byla dočasná fáze do PoS
26. dubna 2024
Offchain Labs odhaluje objev dvou kritických zranitelností v důkazech o podvodech OP Stack společnosti Optimism
Novinky Vývoj Technika
Offchain Labs odhaluje objev dvou kritických zranitelností v důkazech o podvodech OP Stack společnosti Optimism
26. dubna 2024
Otevřený trh společnosti Dymension pro překlenutí likvidity z RollApps eIBC se spouští v síti Mainnet
Novinky Technika
Otevřený trh společnosti Dymension pro překlenutí likvidity z RollApps eIBC se spouští v síti Mainnet 
26. dubna 2024
CRYPTOMERIA LABS PTE. LTD.