GPT-4 Gumaganap nang Mas Mahusay kaysa sa Karaniwang Tao sa Pagsubok ng Lohikal na Pangangatuwiran, Mga Pag-aangkin sa Pag-aaral
Sa madaling sabi
Si Ilya Pestov, isang Russian AI researcher, ay lumikha ng pagsubok sa lohikal na pag-iisip, na naipasa ng 12 libong tao.
Kamakailan ay nakakuha siya ng access sa mas matalinong GPT-4, at nagsagawa ng isang eksperimento upang makita kung ang tamang query ay maaaring magbunga ng ilang mga resulta.
Ang mga resulta ay nagpakita na ang GPT-4 nalampasan ang karaniwang tao sa lohikal na pangangatwiran.
Si Ilya Pestov, isang kilalang Russian AI researcher, ay nag-post ng mensahe sa kanya Telegram channel tungkol sa kung gaano kahusay pinangangasiwaan ng neural network ang mga lohikal na pagsubok. Minsang nilikha ni Ilya ang @psylogicbot pagsubok ng lohikal na pag-iisip, na kinuha ng humigit-kumulang 12 libong tao. Maaari mong tingnan ang mga istatistika pagkatapos kumuha ng pagsusulit.
Magbasa nang higit pa: 20+ Pinakamahusay na Telegram AI Chatbots ng 2023 |
Sinulat niya iyon ChatGPT nasubok din, ngunit ang mga resulta ay umalis ng maraming naisin. Kamakailan ay nakakuha siya ng access sa mas matalino at mas updated na bersyon ng GPT modelo—GPT-4—at nagpasya na suriin kung magkakaroon ito ng mga katulad na resulta.
Ang eksperimento ay isinagawa tulad ng sumusunod: Ang mananaliksik ay lumikha ng isang teksto na naglalarawan sa gawain na kailangang tapusin ng neural network. Ipinost ng mananaliksik ang lahat sa mga komento: Ang senyas ay: “Bibigyan kita ng logic puzzle at apat na posibleng sagot; piliin ang isang tamang sagot mula sa kanila." Pagkatapos, para sa bawat pagsubok na tanong, lumikha si Ilya ng bagong dialog at ipinadala ang GPT-4 paglalarawan kasama ang teksto ng tanong. Natanggap ng bot ang tugon nang walang anumang pagwawasto o pahiwatig.
Mayroong 25 katanungan sa kabuuan, na may isang puntos na iginawad para sa bawat tamang sagot. Ayon sa istatistika, ang mga gumagamit ay nakakuha ng average na 13.6 puntos, na may median na hindi hihigit sa 14. Magkano ang GPT-4 makuha? Nakakuha ito ng 16 puntos!
Muli, nahihigitan ng neural network ang karaniwang tao sa lohikal na pangangatwiran. Ibig sabihin, nahihigitan nito ang karamihan sa mga taong nasubok. At ito ay pagkatapos isaalang-alang:
- Ang pagsusulit ay isinagawa sa Russian, habang ang modelo ay pino para sa Ingles;
- GPT-4, na ginagamit sa chat, ay hindi gaanong matalino kaysa sa hinalinhan nito (isang side effect ng mga etikal na paghihigpit).
Hiwalay, magpo-post kami ng mahusay na sagot sa tanong 22, kung saan ginamit ng neuron ang first-order logic upang makuha ang resulta sa matematika. Bagama't saklaw ito ng inilapat na matematika, hindi ito kurso sa unibersidad na kinukuha ng lahat.
Naniniwala pa rin yan neural network ay isang uso? Una, subukang higitan ang pagganap GPT-4 (at ibahagi ang iyong mga resulta sa mga komento).
Magbasa pa tungkol sa AI:
Pagtanggi sa pananagutan
Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.
Tungkol sa Ang May-akda
Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.
Mas marami pang artikuloSi Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.