Març 16, 2023

GPT-4 Hereta fets "al·lucinants" i errors de raonament d'anteriors GPT Models

Publicat: 16 de març de 2023 a les 10:30 Actualitzat: 16 de març de 2023 a les 10:30

En breu

OpenAI diu GPT-4 té limitacions semblants a les anteriors GPT models.

GPT-4 encara al·lucina els fets i comet errors de raonament.

No obstant això, GPT-4 puntua un 40% més que OpenAIúltim GPT-3.5 sobre les avaluacions contradictòries internes de l'empresa.

GPT-4 Hereta fets "al·lucinants" i errors de raonament d'anteriors GPT Models

OpenAI ha advertit als usuaris que el seu darrer model d'idioma, GPT-4, encara no és del tot fiable i pot "al·lucinar" fets i cometre errors de raonament. L'empresa insta els usuaris a tenir precaució quan s'utilitzen resultats del model lingüístic, especialment en "contextos de gran risc".

Tanmateix, la bona notícia és que GPT-4 redueix significativament les al·lucinacions en relació amb models anteriors. OpenAI afirma que GPT-4 puntua un 40% més que l'últim GPT-3.5 sobre les avaluacions internes de la realitat contradictòria.

"Hem avançat en punts de referència externs com TruthfulQA, que posa a prova la capacitat del model per separar fets d'un conjunt d'afirmacions incorrectes seleccionades de manera adversària. Aquestes preguntes es combinen amb respostes incorrectes de fet que són estadísticament atractives ". OpenAI va escriure en a entrada de bloc.

Malgrat aquesta millora, el model encara no té coneixement dels esdeveniments que es van produir després de setembre de 2021 i, de vegades, cometen errors de raonament senzills, igual que els models anteriors. A més, pot ser massa crédule en acceptar declaracions falses òbvies dels usuaris i fallar en problemes difícils, com ara introduir vulnerabilitats de seguretat al seu codi. Tampoc verifica la informació que proporciona.

Igual que els seus predecessors, GPT-4 pot generar consells nocius, codi defectuós o informació inexacta. Tanmateix, les capacitats addicionals del model donen lloc a noves superfícies de risc que cal entendre. Per avaluar l'abast d'aquests riscos, més de 50 experts de diversos dominis, inclosos els riscos d'alineació de la IA, la ciberseguretat, el risc biològic, la confiança i la seguretat i la seguretat internacional, es van comprometre per provar el model de manera adversa. Després, els seus comentaris i dades es van utilitzar per millorar el model, com ara la recollida de dades addicionals per millorar GPT-4la capacitat de rebutjar sol·licituds sobre com sintetitzar substàncies químiques perilloses.

Una de les vies principals OpenAI redueix les sortides nocives incorporant un senyal addicional de recompensa de seguretat durant l'entrenament RLHF (Reinforcement Learning from Human Feedback). El senyal entrena el model per rebutjar les sol·licituds de contingut nociu, com defisegons les directrius d'ús del model. La recompensa la proporciona a GPT-4 classificador zero-shot, que jutja els límits de seguretat i l'estil de finalització a les indicacions relacionades amb la seguretat.

OpenAI també va dir que havia disminuït la tendència del model a respondre a les sol·licituds de contingut no permesos en un 82% en comparació amb GPT-3.5, i GPT-4 respon a sol·licituds sensibles com ara assessorament mèdic i autolesions d'acord amb les polítiques de l'empresa un 29% més sovint.

Mentre que OpenAILes intervencions de 's han augmentat la dificultat de provocar un mal comportament GPT-4, encara és possible, i encara hi ha jailbreaks que poden generar contingut que infringeix les directrius d'ús.

"A mesura que els sistemes d'IA esdevenen més freqüents, assolir alts graus de fiabilitat en aquestes intervencions serà cada cop més crític. De moment, és essencial complementar aquestes limitacions amb tècniques de seguretat durant el desplegament, com ara el seguiment d'abús", va afegir la companyia.

OpenAI està col·laborant amb investigadors externs per entendre i avaluar millor els impactes potencials de GPT-4 i els seus models successors. L'equip també està desenvolupant avaluacions de capacitats perilloses que poden sorgir en futurs sistemes d'IA. Mentre continuen estudiant el potencial social i impactes econòmics of GPT-4 i altres sistemes d'IA, OpenAI compartiran les seves conclusions i idees amb el públic en el seu moment.

Llegir més:

etiquetes:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

Cindy és periodista a Metaverse Post, tractant temes relacionats amb web3, NFT, metavers i IA, amb un focus en les entrevistes amb Web3 actors del sector. Ha parlat amb més de 30 executius de nivell C i comptant, aportant els seus valuosos coneixements als lectors. Cindy, originària de Singapur, ara té la seu a Tbilisi, Geòrgia. Té una llicenciatura en Comunicació i Estudis de Mitjans de Comunicació per la Universitat d'Austràlia Meridional i té una dècada d'experiència en periodisme i escriptura. Posa't en contacte amb ella via [protegit per correu electrònic] amb presentacions de premsa, anuncis i oportunitats d'entrevistes.

més articles

Cindy Tan