Tudósítást Technológia
Március 16, 2023

GPT-4 Korábbról örökli a „hallucináló” tényeket és az érvelési hibákat GPT Modellek

Röviden

OpenAI azt mondja, GPT-4 hasonló korlátai vannak, mint korábban GPT modellek.

GPT-4 még mindig hallucinál tényeket és érvelési hibákat követ el.

Azonban, GPT-4 40%-kal magasabb pontszámot ér el, mint OpenAIlegújabb GPT-3.5 a vállalat belső kontradiktórius tényértékeléseiről.

GPT-4 A „hallucináló” tényeket és az érvelési hibákat a korábbiakból örökölte GPT Modellek

OpenAI figyelmeztette a felhasználókat, hogy legújabb nyelvi modellje, GPT-4, még mindig nem teljesen megbízható, és „hallucinál” tényeket és érvelési hibákat véthet. A vállalat arra kéri a felhasználókat, hogy legyenek körültekintőek a nyelvi modell kimeneteinek használatakor, különösen a „nagy téttel rendelkező kontextusokban”.

A jó hír azonban az GPT-4 jelentősen csökkenti a hallucinációkat a korábbi modellekhez képest. OpenAI azt állítja GPT-4 40%-kal magasabb pontszámot ér el, mint a legutóbbi GPT-3.5 a belső kontradiktórius tényértékelésekről. 

keresztül OpenAI

„Előrelépéseket értünk el az olyan külső benchmarkok terén, mint a TruthfulQA, amely azt teszteli, hogy a modell képes-e elkülöníteni a tényeket az ellenfél által kiválasztott helytelen állítások halmazától. Ezek a kérdések tényszerűen helytelen válaszokkal párosulnak, amelyek statisztikailag vonzóak.” OpenAI írta a blogbejegyzés.

A javulás ellenére a modell még mindig nem ismeri a 2021 szeptembere után történt eseményeket, és néha egyszerű érvelési hibákat követ el, akárcsak a korábbi modellek. Ezen túlmenően túlságosan is hiszékeny lehet a felhasználók nyilvánvaló hamis állításainak elfogadásában, és kudarcot vallanak olyan nehéz problémák esetén, mint például a biztonsági rések beillesztése a kódjába. Ezenkívül nem ellenőrzi tényszerűen az általa szolgáltatott információkat.

Mint elődei, GPT-4 káros tanácsokat, hibás kódokat vagy pontatlan információkat generálhat. A modell további képességei azonban új kockázati felületekhez vezetnek, amelyeket meg kell érteni. E kockázatok mértékének felméréséhez több mint 50 szakértő különböző területekről, köztük a mesterséges intelligencia összehangolási kockázatairól, a kiberbiztonságról, a biológiai kockázatról, a bizalomról és biztonságról és a nemzetközi biztonságról, bevontak a modell ellentmondásos tesztelésére. Visszajelzéseiket és adataikat ezután a modell fejlesztésére használták fel, például további adatok gyűjtésére a fejlesztés érdekében GPT-4képes visszautasítani a veszélyes vegyi anyagok szintézisére vonatkozó kéréseket.

Az egyik fő módja OpenAI A káros kimenetek csökkentése egy további biztonsági jutalomjel beépítésével történik az RLHF (Reinforcement Learning from Human Feedback) képzés során. A jel arra tanítja a modellt, hogy elutasítsa a káros tartalomra vonatkozó kéréseket, pl defia modell használati irányelvei szerint. A jutalmat a GPT-4 zero-shot osztályozó, amely a biztonsággal kapcsolatos felszólítások alapján ítéli meg a biztonsági határokat és a befejezési stílust.

OpenAI azt is elmondta, hogy 82%-kal csökkentette a modell azon tendenciáját, hogy válaszoljon a tiltott tartalomra vonatkozó kérésekre. GPT-3.5 és GPT-4 29%-kal gyakrabban válaszol az olyan kényes kérésekre, mint az orvosi tanácsadás és az önkárosítás a vállalat irányelveinek megfelelően.

keresztül OpenAI

Míg OpenAIbeavatkozásai megnövelték a rossz viselkedés kiváltásának nehézségét GPT-4, továbbra is lehetséges, és továbbra is vannak olyan jailbreak-ek, amelyek a használati irányelveket sértő tartalmat generálhatnak. 

„Ahogy az AI-rendszerek egyre elterjedtebbek, egyre fontosabbá válik a nagyfokú megbízhatóság elérése ezekben a beavatkozásokban. Egyelőre elengedhetetlen, hogy ezeket a korlátozásokat a telepítési időre vonatkozó biztonsági technikákkal egészítsük ki, mint például a visszaélések megfigyelése” – tette hozzá a vállalat.

OpenAI együttműködik külső kutatókkal, hogy jobban megértse és értékelje a lehetséges hatásokat GPT-4 és utódmodelljei. A csapat emellett értékeléseket is fejleszt a jövőbeli mesterséges intelligencia-rendszerekben felmerülő veszélyes képességekre vonatkozóan. Ahogy tovább tanulmányozzák a lehetséges társadalmi és gazdasági hatások of GPT-4 és más AI-rendszerek, OpenAI eredményeiket és meglátásaikat kellő időben megosztják a nyilvánossággal.

Bővebben:

Címkék:

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Cindy újságíró a cégnél Metaverse Post, amelyhez kapcsolódó témákat fed fel web3, NFT, metaverzum és mesterséges intelligencia, különös tekintettel a vele készült interjúkra Web3 iparági szereplők. Több mint 30 C-szintű vezetővel beszélt, akik értékes ismereteiket juttatták el az olvasókhoz. Az eredetileg Szingapúrból származó Cindy jelenleg Tbilisziben, Grúziában él. Kommunikáció és médiatudomány szakon szerzett alapdiplomát a Dél-ausztrál Egyetemen, és több évtizedes tapasztalattal rendelkezik az újságírás és az írás terén. Vedd fel vele a kapcsolatot ezen keresztül [e-mail védett] sajtóbemutatókkal, közleményekkel és interjúlehetőségekkel.

További cikkek
Cindy Tan
Cindy Tan

Cindy újságíró a cégnél Metaverse Post, amelyhez kapcsolódó témákat fed fel web3, NFT, metaverzum és mesterséges intelligencia, különös tekintettel a vele készült interjúkra Web3 iparági szereplők. Több mint 30 C-szintű vezetővel beszélt, akik értékes ismereteiket juttatták el az olvasókhoz. Az eredetileg Szingapúrból származó Cindy jelenleg Tbilisziben, Grúziában él. Kommunikáció és médiatudomány szakon szerzett alapdiplomát a Dél-ausztrál Egyetemen, és több évtizedes tapasztalattal rendelkezik az újságírás és az írás terén. Vedd fel vele a kapcsolatot ezen keresztül [e-mail védett] sajtóbemutatókkal, közleményekkel és interjúlehetőségekkel.

A DOGE Frenzy: A Dogecoin (DOGE) közelmúltbeli értéknövekedésének elemzése

A kriptovaluta ipar rohamosan bővül, a mémérmék pedig jelentős fellendülésre készülnek. Dogecoin (DOGE), ...

Tudjon meg többet

A mesterséges intelligencia által generált tartalom evolúciója a metaverzumban

A generatív AI-tartalom megjelenése az egyik leglenyűgözőbb fejlemény a virtuális környezetben...

Tudjon meg többet
Csatlakozzon innovatív technológiai közösségünkhöz
KATT ide
Tovább
A hét legjobb ajánlatai, jelentősebb befektetések az AI-ba, IT-be, Web3és Crypto (22-26.04)
megemészteni üzleti piacok Technológia
A hét legjobb ajánlatai, jelentősebb befektetések az AI-ba, IT-be, Web3és Crypto (22-26.04)
April 26, 2024
Vitalik Buterin megjegyzéseket fűzött a PoW központosításához, megjegyzi, hogy az ideiglenes szakasz volt a PoS-ig
Tudósítást Technológia
Vitalik Buterin megjegyzéseket fűzött a PoW központosításához, megjegyzi, hogy az ideiglenes szakasz volt a PoS-ig
April 26, 2024
Az Offchain Labs két kritikus sebezhetőséget tárt fel az Optimism OP Stack csalási bizonyítékaiban
Tudósítást szoftver Technológia
Az Offchain Labs két kritikus sebezhetőséget tárt fel az Optimism OP Stack csalási bizonyítékaiban
April 26, 2024
Megjelent a Dymension nyílt piaca a RollApps eIBC likviditásának áthidalására a központi hálózaton
Tudósítást Technológia
Megjelent a Dymension nyílt piaca a RollApps eIBC likviditásának áthidalására a központi hálózaton 
April 26, 2024
CRYPTOMERIA LABS PTE. KFT.