Notizie Tecnologia
16 Marzo 2023

GPT-4 Eredita fatti “allucinanti” ed errori di ragionamento da prima GPT Modelli

In Breve

OpenAI dice GPT-4 presenta limitazioni simili a quelle precedenti GPT modelli.

GPT-4 ha ancora allucinazioni sui fatti e commette errori di ragionamento.

Però, i GPT-4 ottiene un punteggio superiore del 40%. OpenAIè l'ultimo GPT-3.5 sulle valutazioni di fattualità contraddittoria interna della società.

GPT-4 Eredita fatti "allucinanti" ed errori di ragionamento da prima GPT Modelli

OpenAI ha avvisato gli utenti che il suo ultimo modello linguistico, GPT-4, non è ancora del tutto affidabile e può “allucinare” i fatti e commettere errori di ragionamento. L’azienda esorta gli utenti a prestare attenzione quando utilizzano i risultati del modello linguistico, soprattutto in “contesti ad alto rischio”.

Tuttavia, la buona notizia è questa GPT-4 riduce significativamente le allucinazioni rispetto ai modelli precedenti. OpenAI afferma che GPT-4 ottiene un punteggio superiore del 40% rispetto al più recente GPT-3.5 sulle valutazioni interne di fattualità contraddittoria. 

via OpenAI

“Abbiamo fatto progressi su benchmark esterni come TruthfulQA, che mette alla prova la capacità del modello di separare i fatti da una serie di affermazioni errate selezionate in modo contraddittorio. Queste domande sono abbinate a risposte effettivamente errate che sono statisticamente interessanti " OpenAI ha scritto in a post sul blog.

Nonostante questo miglioramento, il modello non conosce ancora gli eventi accaduti dopo settembre 2021 e talvolta commette semplici errori di ragionamento, proprio come i modelli precedenti. Inoltre, può essere eccessivamente credulone nell'accettare ovvie dichiarazioni false da parte degli utenti e fallire in problemi difficili, come l'introduzione di vulnerabilità di sicurezza nel suo codice. Inoltre, non verifica le informazioni fornite.

Come i suoi predecessori, GPT-4 può generare consigli dannosi, codice difettoso o informazioni imprecise. Tuttavia, le capacità aggiuntive del modello portano a nuove superfici di rischio che devono essere comprese. Per valutare l’entità di questi rischi, oltre 50 esperti provenienti da vari ambiti, tra cui i rischi di allineamento dell’intelligenza artificiale, la sicurezza informatica, il rischio biologico, la fiducia e la sicurezza e la sicurezza internazionale, sono stati coinvolti per testare in modo contraddittorio il modello. Il loro feedback e i dati sono stati poi utilizzati per migliorare il modello, ad esempio raccogliendo dati aggiuntivi per migliorarlo GPT-4La capacità di rifiutare richieste su come sintetizzare sostanze chimiche pericolose.

Uno dei modi principali OpenAI sta riducendo gli output dannosi incorporando un ulteriore segnale di ricompensa per la sicurezza durante la formazione RLHF (Reinforcement Learning from Human Feedback). Il segnale addestra il modello a rifiutare le richieste di contenuti dannosi, come defined dalle linee guida di utilizzo del modello. La ricompensa è fornita da a GPT-4 classificatore zero-shot, che giudica i limiti di sicurezza e lo stile di completamento sui prompt relativi alla sicurezza.

OpenAI ha inoltre affermato di aver diminuito dell'82% la tendenza del modello a rispondere alle richieste di contenuti non consentiti rispetto a GPT-3.5 e GPT-4 risponde a richieste sensibili come consigli medici e atti di autolesionismo in conformità con le politiche aziendali il 29% più spesso.

via OpenAI

Mentre OpenAIGli interventi di hanno aumentato la difficoltà di suscitare comportamenti scorretti da parte degli utenti GPT-4, è ancora possibile ed esistono ancora jailbreak che possono generare contenuti che violano le linee guida sull'utilizzo. 

“Man mano che i sistemi di intelligenza artificiale diventano più diffusi, il raggiungimento di elevati livelli di affidabilità in questi interventi diventerà sempre più critico. Per ora, è essenziale integrare queste limitazioni con tecniche di sicurezza al momento dell'implementazione come il monitoraggio degli abusi", ha aggiunto la società.

OpenAI sta collaborando con ricercatori esterni per comprendere e valutare meglio i potenziali impatti di GPT-4 e i suoi modelli successivi. Il team sta inoltre sviluppando valutazioni per capacità pericolose che potrebbero emergere nei futuri sistemi di intelligenza artificiale. Mentre continuano a studiare il potenziale sociale e impatti economici of GPT-4 e altri sistemi di intelligenza artificiale, OpenAI condivideranno le loro scoperte e approfondimenti con il pubblico a tempo debito.

Leggi di più:

Tag:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Cindy è una giornalista di Metaverse Post, che copre argomenti relativi a web3, NFT, metaverso e intelligenza artificiale, con particolare attenzione alle interviste con Web3 attori del settore. Ha parlato con oltre 30 dirigenti di livello C e oltre, portando ai lettori le loro preziose intuizioni. Originaria di Singapore, Cindy ora vive a Tbilisi, in Georgia. Ha conseguito una laurea in comunicazioni e studi sui media presso l'Università dell'Australia Meridionale e ha dieci anni di esperienza nel giornalismo e nella scrittura. Mettiti in contatto con lei tramite [email protected] con presentazioni per la stampa, annunci e opportunità di interviste.

Altri articoli
Cindy Tan
Cindy Tan

Cindy è una giornalista di Metaverse Post, che copre argomenti relativi a web3, NFT, metaverso e intelligenza artificiale, con particolare attenzione alle interviste con Web3 attori del settore. Ha parlato con oltre 30 dirigenti di livello C e oltre, portando ai lettori le loro preziose intuizioni. Originaria di Singapore, Cindy ora vive a Tbilisi, in Georgia. Ha conseguito una laurea in comunicazioni e studi sui media presso l'Università dell'Australia Meridionale e ha dieci anni di esperienza nel giornalismo e nella scrittura. Mettiti in contatto con lei tramite [email protected] con presentazioni per la stampa, annunci e opportunità di interviste.

La frenesia del DOGE: analisi del recente aumento di valore di Dogecoin (DOGE).

L’industria delle criptovalute è in rapida espansione e le monete meme si stanno preparando per una significativa ripresa. Dogecoin (DOGE), ...

Per saperne di più

L'evoluzione dei contenuti generati dall'intelligenza artificiale nel Metaverso

L’emergere di contenuti di intelligenza artificiale generativa è uno degli sviluppi più affascinanti all’interno dell’ambiente virtuale…

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Le migliori offerte di questa settimana, i principali investimenti in AI, IT, Web3e Criptovaluta (22-26.04)
digerire Affari Mercati Tecnologia
Le migliori offerte di questa settimana, i principali investimenti in AI, IT, Web3e Criptovaluta (22-26.04)
26 aprile 2024
Vitalik Buterin commenta la centralizzazione del PoW, sottolineando che si trattava di una fase temporanea fino al PoS
Notizie Tecnologia
Vitalik Buterin commenta la centralizzazione del PoW, sottolineando che si trattava di una fase temporanea fino al PoS
26 aprile 2024
Offchain Labs rivela la scoperta di due vulnerabilità critiche nelle prove di frode dello stack OP di Optimism
Notizie Software Tecnologia
Offchain Labs rivela la scoperta di due vulnerabilità critiche nelle prove di frode dello stack OP di Optimism
26 aprile 2024
Il mercato aperto di Dymension per colmare la liquidità da RollApps eIBC viene lanciato su Mainnet
Notizie Tecnologia
Il mercato aperto di Dymension per colmare la liquidità da RollApps eIBC viene lanciato su Mainnet 
26 aprile 2024
LABORATORI DI CRITTOMERIA PTE. srl.