Notizie Tecnologia
29 Marzo 2023

GPT-4 Risultati migliori della persona media in un test di ragionamento logico, affermazioni di studio

In Breve

Ilya Pestov, un ricercatore russo di intelligenza artificiale, ha creato il test del pensiero logico, che è stato superato da 12mila persone.

Recentemente ha ottenuto l'accesso allo smarter GPT-4e ho condotto un esperimento per vedere se la query giusta poteva produrre alcuni risultati.

I risultati hanno mostrato che il GPT-4 ha sovraperformato la persona media nel ragionamento logico.

Ilya Pestov, un noto ricercatore russo di intelligenza artificiale, ha pubblicato un messaggio sul suo Canale di Telegram su quanto bene la rete neurale gestisce i test logici. Ilya una volta ha creato il file @psylogicbot test di pensiero logico, che è stato sostenuto da circa 12mila persone. Puoi controllare le statistiche dopo aver sostenuto il test.

@Midjourney /Abdalla(hamoXX)#7378
Leggi di più: Oltre 20 migliori chatbot AI di Telegram del 2023

Ha scritto che ChatGPT sono stati anche testati, ma i risultati lasciavano molto a desiderare. Recentemente ha avuto accesso alla versione più intelligente e aggiornata di GPT modello-GPT-4- e ho deciso di verificare se avrebbe ottenuto risultati simili.

L'esperimento è stato condotto come segue: il ricercatore ha creato un testo che descriveva il compito che la rete neurale doveva completare. Il ricercatore ha pubblicato tutto nei commenti: Il prompt è stato: “Ti darò un puzzle logico e quattro possibili risposte; scegli l'unica risposta corretta da loro. Quindi, per ogni domanda del test, Ilya ha creato un nuovo dialogo e ha inviato il file GPT-4 descrizione insieme al testo della domanda. Il bot ha ricevuto la risposta senza correzioni o suggerimenti.

Ci sono 25 domande in totale, con un punto assegnato per ogni risposta corretta. Secondo le statistiche, gli utenti ottengono in media 13.6 punti, con una media non superiore a 14. Quanto ha fatto GPT-4 Ottenere? È riuscito a ottenere 16 punti!

Ancora una volta, la rete neurale supera la persona media nel ragionamento logico. Cioè, supera la maggior parte delle persone testate. E questo dopo aver preso in considerazione:

  • Il test è stato condotto in russo, mentre il modello è ottimizzato per l'inglese;
  • GPT-4, utilizzato in chat, è meno intelligente del suo predecessore (un effetto collaterale delle restrizioni etiche).

Separatamente, pubblicheremo un'eccellente risposta alla domanda 22, in cui il neurone ha utilizzato la logica del primo ordine per derivare matematicamente il risultato. Sebbene questo fosse trattato in matematica applicata, non è un corso universitario che tutti frequentano.

Separatamente, pubblicheremo un'eccellente risposta alla domanda 22 in cui il neurone ha utilizzato la logica del primo ordine per derivare matematicamente il risultato. Sapevamo tutti come farlo anche in matematica applicata, ma era un corso in più all'università.

Ci credo ancora reti neurali sono una moda passeggera? Per prima cosa, prova a sovraperformare GPT-4 (e condividi i tuoi risultati nei commenti).

Per saperne di più sull'intelligenza artificiale:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Altri articoli
Damir Jalalov
Damir Jalalov

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

La frenesia del DOGE: analisi del recente aumento di valore di Dogecoin (DOGE).

L’industria delle criptovalute è in rapida espansione e le monete meme si stanno preparando per una significativa ripresa. Dogecoin (DOGE), ...

Per saperne di più

L'evoluzione dei contenuti generati dall'intelligenza artificiale nel Metaverso

L’emergere di contenuti di intelligenza artificiale generativa è uno degli sviluppi più affascinanti all’interno dell’ambiente virtuale…

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Le migliori offerte di questa settimana, i principali investimenti in AI, IT, Web3e Criptovaluta (22-26.04)
digerire Affari Mercati Tecnologia
Le migliori offerte di questa settimana, i principali investimenti in AI, IT, Web3e Criptovaluta (22-26.04)
26 aprile 2024
Vitalik Buterin commenta la centralizzazione del PoW, sottolineando che si trattava di una fase temporanea fino al PoS
Notizie Tecnologia
Vitalik Buterin commenta la centralizzazione del PoW, sottolineando che si trattava di una fase temporanea fino al PoS
26 aprile 2024
Offchain Labs rivela la scoperta di due vulnerabilità critiche nelle prove di frode dello stack OP di Optimism
Notizie Software Tecnologia
Offchain Labs rivela la scoperta di due vulnerabilità critiche nelle prove di frode dello stack OP di Optimism
26 aprile 2024
Il mercato aperto di Dymension per colmare la liquidità da RollApps eIBC viene lanciato su Mainnet
Notizie Tecnologia
Il mercato aperto di Dymension per colmare la liquidità da RollApps eIBC viene lanciato su Mainnet 
26 aprile 2024
LABORATORI DI CRITTOMERIA PTE. srl.