Informe de notícies Tecnologia
Març 16, 2023

GPT-4 Hereta fets "al·lucinants" i errors de raonament d'anteriors GPT Models

En breu

OpenAI diu GPT-4 té limitacions semblants a les anteriors GPT models.

GPT-4 encara al·lucina els fets i comet errors de raonament.

No obstant això, GPT-4 puntua un 40% més que OpenAIúltim GPT-3.5 sobre les avaluacions contradictòries internes de l'empresa.

GPT-4 Hereta fets "al·lucinants" i errors de raonament d'anteriors GPT Models

OpenAI ha advertit als usuaris que el seu darrer model d'idioma, GPT-4, encara no és del tot fiable i pot "al·lucinar" fets i cometre errors de raonament. L'empresa insta els usuaris a tenir precaució quan s'utilitzen resultats del model lingüístic, especialment en "contextos de gran risc".

Tanmateix, la bona notícia és que GPT-4 redueix significativament les al·lucinacions en relació amb models anteriors. OpenAI afirma que GPT-4 puntua un 40% més que l'últim GPT-3.5 sobre les avaluacions internes de la realitat contradictòria. 

per OpenAI

"Hem avançat en punts de referència externs com TruthfulQA, que posa a prova la capacitat del model per separar fets d'un conjunt d'afirmacions incorrectes seleccionades de manera adversària. Aquestes preguntes es combinen amb respostes incorrectes de fet que són estadísticament atractives ". OpenAI va escriure en a entrada de bloc.

Malgrat aquesta millora, el model encara no té coneixement dels esdeveniments que es van produir després de setembre de 2021 i, de vegades, cometen errors de raonament senzills, igual que els models anteriors. A més, pot ser massa crédule en acceptar declaracions falses òbvies dels usuaris i fallar en problemes difícils, com ara introduir vulnerabilitats de seguretat al seu codi. Tampoc verifica la informació que proporciona.

Igual que els seus predecessors, GPT-4 pot generar consells nocius, codi defectuós o informació inexacta. Tanmateix, les capacitats addicionals del model donen lloc a noves superfícies de risc que cal entendre. Per avaluar l'abast d'aquests riscos, més de 50 experts de diversos dominis, inclosos els riscos d'alineació de la IA, la ciberseguretat, el risc biològic, la confiança i la seguretat i la seguretat internacional, es van comprometre per provar el model de manera adversa. Després, els seus comentaris i dades es van utilitzar per millorar el model, com ara la recollida de dades addicionals per millorar GPT-4la capacitat de rebutjar sol·licituds sobre com sintetitzar substàncies químiques perilloses.

Una de les vies principals OpenAI redueix les sortides nocives incorporant un senyal addicional de recompensa de seguretat durant l'entrenament RLHF (Reinforcement Learning from Human Feedback). El senyal entrena el model per rebutjar les sol·licituds de contingut nociu, com defisegons les directrius d'ús del model. La recompensa la proporciona a GPT-4 classificador zero-shot, que jutja els límits de seguretat i l'estil de finalització a les indicacions relacionades amb la seguretat.

OpenAI també va dir que havia disminuït la tendència del model a respondre a les sol·licituds de contingut no permesos en un 82% en comparació amb GPT-3.5, i GPT-4 respon a sol·licituds sensibles com ara assessorament mèdic i autolesions d'acord amb les polítiques de l'empresa un 29% més sovint.

per OpenAI

Mentre que OpenAILes intervencions de 's han augmentat la dificultat de provocar un mal comportament GPT-4, encara és possible, i encara hi ha jailbreaks que poden generar contingut que infringeix les directrius d'ús. 

"A mesura que els sistemes d'IA esdevenen més freqüents, assolir alts graus de fiabilitat en aquestes intervencions serà cada cop més crític. De moment, és essencial complementar aquestes limitacions amb tècniques de seguretat durant el desplegament, com ara el seguiment d'abús", va afegir la companyia.

OpenAI està col·laborant amb investigadors externs per entendre i avaluar millor els impactes potencials de GPT-4 i els seus models successors. L'equip també està desenvolupant avaluacions de capacitats perilloses que poden sorgir en futurs sistemes d'IA. Mentre continuen estudiant el potencial social i impactes econòmics of GPT-4 i altres sistemes d'IA, OpenAI compartiran les seves conclusions i idees amb el públic en el seu moment.

Llegir més:

etiquetes:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

Cindy és periodista a Metaverse Post, tractant temes relacionats amb web3, NFT, metavers i IA, amb un focus en les entrevistes amb Web3 actors del sector. Ha parlat amb més de 30 executius de nivell C i comptant, aportant els seus valuosos coneixements als lectors. Cindy, originària de Singapur, ara té la seu a Tbilisi, Geòrgia. Té una llicenciatura en Comunicació i Estudis de Mitjans de Comunicació per la Universitat d'Austràlia Meridional i té una dècada d'experiència en periodisme i escriptura. Posa't en contacte amb ella via [protegit per correu electrònic] amb presentacions de premsa, anuncis i oportunitats d'entrevistes.

més articles
Cindy Tan
Cindy Tan

Cindy és periodista a Metaverse Post, tractant temes relacionats amb web3, NFT, metavers i IA, amb un focus en les entrevistes amb Web3 actors del sector. Ha parlat amb més de 30 executius de nivell C i comptant, aportant els seus valuosos coneixements als lectors. Cindy, originària de Singapur, ara té la seu a Tbilisi, Geòrgia. Té una llicenciatura en Comunicació i Estudis de Mitjans de Comunicació per la Universitat d'Austràlia Meridional i té una dècada d'experiència en periodisme i escriptura. Posa't en contacte amb ella via [protegit per correu electrònic] amb presentacions de premsa, anuncis i oportunitats d'entrevistes.

The DOGE Frenzy: anàlisi de l'augment recent del valor de Dogecoin (DOGE).

La indústria de la criptomoneda s'està expandint ràpidament i les monedes memes es preparen per a un augment significatiu. Dogecoin (DOGE),...

saber Més

L'evolució del contingut generat per IA al metavers

L'aparició del contingut generatiu d'IA és un dels desenvolupaments més fascinants dins de l'entorn virtual...

saber Més
Uneix-te a la nostra comunitat tecnològica innovadora
Més...
Llegeix més
Les millors ofertes d'aquesta setmana, les principals inversions en IA, TI, Web3i Crypto (22-26.04)
Resum Negocis mercats Tecnologia
Les millors ofertes d'aquesta setmana, les principals inversions en IA, TI, Web3i Crypto (22-26.04)
Abril 26, 2024
Vitalik Buterin comenta sobre la centralització de PoW, assenyala que va ser una etapa temporal fins a PoS
Informe de notícies Tecnologia
Vitalik Buterin comenta sobre la centralització de PoW, assenyala que va ser una etapa temporal fins a PoS
Abril 26, 2024
Offchain Labs revela el descobriment de dues vulnerabilitats crítiques a les proves de frau de l'OP Stack d'Optimism
Informe de notícies Software Tecnologia
Offchain Labs revela el descobriment de dues vulnerabilitats crítiques a les proves de frau de l'OP Stack d'Optimism
Abril 26, 2024
El mercat obert de Dymension per a la liquiditat de pont de RollApps eIBC es llança a Mainnet
Informe de notícies Tecnologia
El mercat obert de Dymension per a la liquiditat de pont de RollApps eIBC es llança a Mainnet 
Abril 26, 2024
CRYPTOMERIA LABS PTE. LTD.