GPT-4 Suoriutuu keskimääräistä paremmin loogisen päättelyn testissä, tutkimus väittää
Lyhyesti
Venäläinen tekoälytutkija Ilja Pestov loi loogisen ajattelun testin, jonka läpäisi 12 tuhatta ihmistä.
Hän sai hiljattain pääsyn älykkäämpiin GPT-4, ja suoritti kokeen nähdäkseen, voisiko oikea kysely tuottaa tuloksia.
Tulokset osoittivat, että GPT-4 päihitti keskimääräisen ihmisen loogisessa päättelyssä.
Tunnettu venäläinen tekoälytutkija Ilja Pestov lähetti viestin omaansa Telegramkanava kuinka hyvin hermoverkko käsittelee loogisia testejä. Ilja loi kerran @psylogicbot loogisen ajattelun testi, jonka suoritti noin 12 tuhatta ihmistä. Voit tarkistaa tilastot testin jälkeen.
Hän kirjoitti sen ChatGPT myös testattiin, mutta tulokset jättivät paljon toivomisen varaa. Hän sai äskettäin pääsyn älykkäämpään ja päivitetympään versioon GPT malli-GPT-4– ja päätti tarkistaa, saako se samanlaisia tuloksia.
Koe suoritettiin seuraavasti: Tutkija loi tekstin, joka kuvasi tehtävää, joka hermoverkon oli suoritettava. Tutkija julkaisi kommenteissa kaiken: Kehotus oli: ”Annan sinulle logiikkapalan ja neljä vastausvaihtoehtoa; valitse niistä yksi oikea vastaus." Sitten jokaiselle testikysymykselle Ilja loi uuden valintaikkunan ja lähetti GPT-4 kuvaus ja kysymysteksti. Botti sai vastauksen ilman korjauksia tai vihjeitä.
Kysymyksiä on yhteensä 25, ja jokaisesta oikeasta vastauksesta saa yhden pisteen. Tilastojen mukaan käyttäjät saavat keskimäärin 13.6 pistettä, mutta mediaani on enintään 14. Kuinka paljon GPT-4 saada? Se onnistui saamaan 16 pistettä!
Jälleen kerran, hermoverkko päihittää keskimääräisen ihmisen loogisessa päättelyssä. Se on siis parempi kuin suurin osa testatuista ihmisistä. Ja tämä on otettu huomioon:
- Testi suoritettiin venäjäksi, malli on hienosäädetty englanniksi;
- GPT-4, jota käytetään chatissa, on vähemmän älykäs kuin edeltäjänsä (eettisten rajoitusten sivuvaikutus).
Julkaisemme erikseen erinomaisen vastauksen kysymykseen 22, jossa neuroni käytti ensimmäisen asteen logiikkaa tuloksen johtamiseen matemaattisesti. Vaikka tämä käsiteltiin sovelletussa matematiikassa, se ei ole kaikkien suorittama yliopistokurssi.
Usko siihen silti hermoverkkoihin ovat muotia? Yritä ensin menestyä paremmin GPT-4 (ja jaa tulokset kommenteissa).
Lue lisää tekoälystä:
Vastuun kieltäminen
Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.
Author
Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.
lisää artikkeleitaDamir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.