Naujienų ataskaita Technologija
Kovo 29, 2023

GPT-4 Atliekant loginio samprotavimo testą sekasi geriau nei vidutinis žmogus, tyrimo teiginiai

Trumpai

Rusijos dirbtinio intelekto tyrinėtojas Ilja Pestovas sukūrė loginio mąstymo testą, kurį išlaikė 12 tūkst.

Jis neseniai gavo prieigą prie protingesnio GPT-4, ir atliko eksperimentą, kad sužinotų, ar tinkama užklausa gali duoti rezultatų.

Rezultatai parodė, kad GPT-4 pralenkė vidutinį žmogų loginiu samprotavimu.

Ilja Pestovas, žinomas Rusijos dirbtinio intelekto tyrinėtojas, paskelbė savo žinią Telegramos kanalas apie tai, kaip gerai neuroninis tinklas atlieka loginius testus. Ilja kažkada sukūrė @psylogicbot loginio mąstymo testą, kurį laikė maždaug 12 tūkst. Atlikę testą, galite peržiūrėti statistiką.

@Midjourney / Abdalla(hamoXX)#7378
Plačiau paskaitykite čia: Daugiau nei 20 geriausių 2023 m. „Telegram AI“ pokalbių robotų

Jis tai parašė ChatGPT taip pat buvo išbandytas, bet rezultatai paliko daug norimų rezultatų. Neseniai jis gavo prieigą prie išmanesnės ir atnaujintos versijos GPT modelis-GPT-4ir nusprendė patikrinti, ar bus gauti panašūs rezultatai.

Eksperimentas buvo atliktas taip: Tyrėjas sukūrė tekstą, kuriame aprašyta užduotis, kurią turėjo atlikti neuroninis tinklas. Tyrėjas viską paskelbė komentaruose: Raginimas buvo toks: „Duosiu jums loginį galvosūkį ir keturis galimus atsakymus; pasirinkite iš jų vieną teisingą atsakymą“. Tada kiekvienam testo klausimui Ilja sukūrė naują dialogo langą ir išsiuntė GPT-4 aprašymas kartu su klausimo tekstu. Botas gavo atsakymą be jokių pataisymų ar užuominų.

Iš viso yra 25 klausimai, už kiekvieną teisingą atsakymą skiriamas vienas taškas. Remiantis statistika, vartotojai vidutiniškai surenka 13.6 balo, o mediana ne didesnė nei 14. Kiek GPT-4 gauti? Pavyko surinkti 16 taškų!

Vėlgi, neuroninis tinklas pranoksta vidutinį žmogų loginiu samprotavimu. Tai yra, jis lenkia daugumą išbandytų žmonių. Ir tai atsižvelgus į:

  • Bandymas buvo atliktas rusų kalba, o modelis tiksliai suderintas anglų kalba;
  • GPT-4, kuris naudojamas pokalbiuose, yra mažiau protingas nei jo pirmtakas (šalutinis etinių apribojimų poveikis).

Atskirai pateiksime puikų atsakymą į 22 klausimą, kuriame neuronas naudojo pirmos eilės logiką, kad gautų rezultatą matematiškai. Nors tai buvo nagrinėjama taikomojoje matematikoje, tai nėra universiteto kursas, kurio visi lanko.

Atskirai pateiksime puikų atsakymą į 22 klausimą, kuriame neuronas naudojo pirmos eilės logiką, kad gautų rezultatą matematiškai. Visi mokėjome tai daryti ir taikomojoje matematikoje, bet tai buvo papildomas kursas universitete.

Vis tiek tiki tuo neuroniniai tinklai yra mada? Pirmiausia pabandykite pranokti GPT-4 (ir pasidalykite rezultatais komentaruose).

Skaitykite daugiau apie AI:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Daugiau straipsnių
Damiras Jalalovas
Damiras Jalalovas

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Hot Stories
Prisijunkite prie mūsų naujienlaiškio.
Paskutinės naujienos

„DOGE Frenzy“: „Dogecoin“ (DOGE) pastarojo meto vertės padidėjimo analizė

Kriptovaliutų pramonė sparčiai plečiasi, o memų monetos ruošiasi reikšmingam pakilimui. Dogecoin (DOGE), ...

Žinoti daugiau

Dirbtinio intelekto sukurto turinio raida metaverse

Generatyvaus dirbtinio intelekto turinio atsiradimas yra vienas įspūdingiausių įvykių virtualioje aplinkoje...

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
Šios savaitės geriausi pasiūlymai, didelės investicijos į AI, IT, Web3ir kriptovaliuta (22–26.04)
Virškinimas Atsakingas verslas rinkos Technologija
Šios savaitės geriausi pasiūlymai, didelės investicijos į AI, IT, Web3ir kriptovaliuta (22–26.04)
Balandis 26, 2024
Vitalikas Buterinas komentuoja belaisvių centralizavimą, pažymi, kad tai buvo laikinas etapas iki PoS
Naujienų ataskaita Technologija
Vitalikas Buterinas komentuoja belaisvių centralizavimą, pažymi, kad tai buvo laikinas etapas iki PoS
Balandis 26, 2024
„Offchain Labs“ atskleidė dvi svarbias „Optimism OP Stack“ sukčiavimo įrodymų spragas
Naujienų ataskaita programinė įranga Technologija
„Offchain Labs“ atskleidė dvi svarbias „Optimism OP Stack“ sukčiavimo įrodymų spragas
Balandis 26, 2024
„Dymension“ atvira rinka, skirta likvidumui perjungti iš „RollApps eIBC“ paleidžiama „Mainnet“
Naujienų ataskaita Technologija
„Dymension“ atvira rinka, skirta likvidumui perjungti iš „RollApps eIBC“ paleidžiama „Mainnet“ 
Balandis 26, 2024
CRYPTOMERIA LABS PTE. LTD.