Notizie SMW Tecnologia
30 Maggio 2023

GPT-4La prestazione di all'esame di avvocato negli Stati Uniti contraddice le sue affermazioni

In Breve

L'esame di GPT-4Il rendimento di all'esame di avvocato ha evidenziato una discrepanza tra il rendimento stimato e quello effettivo, sottolineando l'importanza di procedure di valutazione trasparenti e di dati accessibili.

OpenAI è incoraggiato ad affrontare le discrepanze e sviluppare un approccio più inclusivo e affidabile alla valutazione del modello di IA per guadagnare fiducia e garantire credibilità.

In un recente esame di GPT-4la sua performance all'esame di avvocato (UBE), sono sorti dubbi sull'esattezza di OpenAIaffermazioni di riguardo al tasso di successo del modello. Contrariamente all'affermazione iniziale che GPT-4 supera il 90% degli individui, i risultati suggeriscono una discrepanza significativa tra le prestazioni stimate e quelle effettive del modello di intelligenza artificiale. Questa rivelazione sottolinea l'importanza di procedure di valutazione trasparenti e di dati accessibili per convalidare tali affermazioni.

GPT-4La prestazione di all'esame di avvocato negli Stati Uniti contraddice le sue affermazioni
@Midjourney

L'esame si è concentrato su vari fattori per accertare le reali capacità dell' GPT-4. In primo luogo, il . degli esami di febbraio in Illinois lo hanno rivelato GPT-4si sono avvicinati a 90o percentile. Tuttavia, è stato osservato che questi punteggi sono stati fortemente influenzati dai ripetitori che in precedenza non avevano superato l'esame di luglio e quindi avevano ottenuto punteggi inferiori alla media complessiva.

Inoltre, i risultati dell'esame di luglio erano contrari OpenAIaffermazioni di, rivelandolo GPT-4 sarebbe solo outperform Il 68% delle persone e il 48% dei saggi. GPT-4La performance di rispetto a coloro che lo hanno scelto per la prima volta (escluse le ripetizioni) è stata valutata al 63° percentile quando sono stati considerati i dati ufficiali di diversi test in periodi diversi, con i saggi che hanno ottenuto un punteggio notevolmente inferiore al 41° percentile.

Un'ulteriore prospettiva è stata acquisita esaminando le prestazioni di coloro che hanno superato l'esame, compresi gli individui con licenza e quelli in attesa di licenza. A questo proposito, GPT-4La performance complessiva di è stata classificata al 48° percentile, mentre i saggi sono andati ancora peggio al 15° percentile.

Sebbene questi risultati siano preoccupanti, è fondamentale considerare la possibilità di errore umano nel processo di revisione. L'autore dell'articolo sottolinea l'importanza di comprendere il campione utilizzato dai ricercatori per valutare GPT-4la prestazione di. La mancanza di dati ufficiali, soprattutto in forma aggregata, rende difficile un confronto equo e una valutazione dei percentili. È fondamentale stabilire tecniche di valutazione chiare e accessibili che possano essere valutate da tutte le parti interessate.

In risposta a queste preoccupazioni, OpenAI è invitato ad affrontare le discrepanze e fornire ulteriori approfondimenti nel processo di valutazione. La trasparenza e l'apertura sono essenziali per guadagnare fiducia e garantire la credibilità dei modelli di intelligenza artificiale in settori ad alto rischio come il diritto.

Va notato che l'articolo non discute il punteggio specifico ottenuto da GPT-4, che risulta essere 298. La valutazione del significato di questo punteggio richiede una comprensione contestuale del sistema di valutazione utilizzato. Proprio come un bambino che torna a casa da scuola con una B potrebbe essere motivo di celebrazione o di delusione, l'interpretazione del GPT-4Il punteggio dipende dalla scala utilizzata.

La valutazione di GPT-4il suo rendimento all'esame di abilitazione desta serie preoccupazioni sulla veridicità di OpenAIle affermazioni iniziali. Il divario tra le prestazioni stimate e quelle effettive sottolinea l'importanza di sistemi di valutazione chiari e di dati facilmente accessibili. OpenAI è incoraggiato ad affrontare queste sfide e a sviluppare un sistema più inclusivo e approccio affidabile all'IA valutazione del modello.

Per saperne di più sull'intelligenza artificiale:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Altri articoli
Damir Jalalov
Damir Jalalov

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Arriva il giorno della sentenza: il destino di CZ è in bilico mentre la Corte degli Stati Uniti considera l'appello del Dipartimento di Giustizia

Changpeng Zhao è pronto ad affrontare oggi la sentenza in un tribunale americano a Seattle.

Per saperne di più

I fondatori di Samourai Wallet sono accusati di aver facilitato 2 miliardi di dollari in affari nel Darknet

L'apprensione dei fondatori di Samourai Wallet rappresenta una notevole battuta d'arresto per il settore, sottolineando la persistente ...

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Chainlink e Rapid Addition collaborano per sviluppare un adattatore Blockchain basato su CCIP
Affari Notizie Tecnologia
Chainlink e Rapid Addition collaborano per sviluppare un adattatore Blockchain basato su CCIP
1 Maggio 2024
BitSmiley lancia Alphanet V1, debutta sul Bitlayer di rete Bitcoin Layer 2
Notizie Tecnologia
BitSmiley lancia Alphanet V1, debutta sul Bitlayer di rete Bitcoin Layer 2
1 Maggio 2024
Aprile 2024 registra un minimo storico di hack e truffe, CertiK segnala un calo del 141% rispetto a marzo
Mercati Sicurezza Wiki Storie e recensioni Tecnologia
Aprile 2024 registra un minimo storico di hack e truffe, CertiK segnala un calo del 141% rispetto a marzo
1 Maggio 2024
Il prezzo del Bitcoin scende in vista dell'annuncio della decisione sul tasso di interesse della Federal Reserve, gli analisti avvertono di un potenziale cambiamento del mercato
Mercati Notizie Tecnologia
Il prezzo del Bitcoin scende in vista dell'annuncio della decisione sul tasso di interesse della Federal Reserve, gli analisti avvertono di un potenziale cambiamento del mercato
1 Maggio 2024
LABORATORI DI CRITTOMERIA PTE. srl.