GPT-4 Atliekant loginio samprotavimo testą sekasi geriau nei vidutinis žmogus, tyrimo teiginiai
Trumpai
Rusijos dirbtinio intelekto tyrinėtojas Ilja Pestovas sukūrė loginio mąstymo testą, kurį išlaikė 12 tūkst.
Jis neseniai gavo prieigą prie protingesnio GPT-4, ir atliko eksperimentą, kad sužinotų, ar tinkama užklausa gali duoti rezultatų.
Rezultatai parodė, kad GPT-4 pralenkė vidutinį žmogų loginiu samprotavimu.
Ilja Pestovas, žinomas Rusijos dirbtinio intelekto tyrinėtojas, paskelbė savo žinią Telegramos kanalas apie tai, kaip gerai neuroninis tinklas atlieka loginius testus. Ilja kažkada sukūrė @psylogicbot loginio mąstymo testą, kurį laikė maždaug 12 tūkst. Atlikę testą, galite peržiūrėti statistiką.
Plačiau paskaitykite čia: Daugiau nei 20 geriausių 2023 m. „Telegram AI“ pokalbių robotų |
Jis tai parašė ChatGPT taip pat buvo išbandytas, bet rezultatai paliko daug norimų rezultatų. Neseniai jis gavo prieigą prie išmanesnės ir atnaujintos versijos GPT modelis-GPT-4ir nusprendė patikrinti, ar bus gauti panašūs rezultatai.
Eksperimentas buvo atliktas taip: Tyrėjas sukūrė tekstą, kuriame aprašyta užduotis, kurią turėjo atlikti neuroninis tinklas. Tyrėjas viską paskelbė komentaruose: Raginimas buvo toks: „Duosiu jums loginį galvosūkį ir keturis galimus atsakymus; pasirinkite iš jų vieną teisingą atsakymą“. Tada kiekvienam testo klausimui Ilja sukūrė naują dialogo langą ir išsiuntė GPT-4 aprašymas kartu su klausimo tekstu. Botas gavo atsakymą be jokių pataisymų ar užuominų.
Iš viso yra 25 klausimai, už kiekvieną teisingą atsakymą skiriamas vienas taškas. Remiantis statistika, vartotojai vidutiniškai surenka 13.6 balo, o mediana ne didesnė nei 14. Kiek GPT-4 gauti? Pavyko surinkti 16 taškų!
Vėlgi, neuroninis tinklas pranoksta vidutinį žmogų loginiu samprotavimu. Tai yra, jis lenkia daugumą išbandytų žmonių. Ir tai atsižvelgus į:
- Bandymas buvo atliktas rusų kalba, o modelis tiksliai suderintas anglų kalba;
- GPT-4, kuris naudojamas pokalbiuose, yra mažiau protingas nei jo pirmtakas (šalutinis etinių apribojimų poveikis).
Atskirai pateiksime puikų atsakymą į 22 klausimą, kuriame neuronas naudojo pirmos eilės logiką, kad gautų rezultatą matematiškai. Nors tai buvo nagrinėjama taikomojoje matematikoje, tai nėra universiteto kursas, kurio visi lanko.
Vis tiek tiki tuo neuroniniai tinklai yra mada? Pirmiausia pabandykite pranokti GPT-4 (ir pasidalykite rezultatais komentaruose).
Skaitykite daugiau apie AI:
Atsakomybės neigimas
Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.
Apie autorių
Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže.
Daugiau straipsniųDamiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže.