Ulat sa Balita Teknolohiya
Marso 29, 2023

GPT-4 Gumaganap nang Mas Mahusay kaysa sa Karaniwang Tao sa Pagsubok ng Lohikal na Pangangatuwiran, Mga Pag-aangkin sa Pag-aaral

Sa madaling sabi

Si Ilya Pestov, isang Russian AI researcher, ay lumikha ng pagsubok sa lohikal na pag-iisip, na naipasa ng 12 libong tao.

Kamakailan ay nakakuha siya ng access sa mas matalinong GPT-4, at nagsagawa ng isang eksperimento upang makita kung ang tamang query ay maaaring magbunga ng ilang mga resulta.

Ang mga resulta ay nagpakita na ang GPT-4 nalampasan ang karaniwang tao sa lohikal na pangangatwiran.

Si Ilya Pestov, isang kilalang Russian AI researcher, ay nag-post ng mensahe sa kanya Telegram channel tungkol sa kung gaano kahusay pinangangasiwaan ng neural network ang mga lohikal na pagsubok. Minsang nilikha ni Ilya ang @psylogicbot pagsubok ng lohikal na pag-iisip, na kinuha ng humigit-kumulang 12 libong tao. Maaari mong tingnan ang mga istatistika pagkatapos kumuha ng pagsusulit.

@Midjourney / Abdalla(hamoXX)#7378
Magbasa nang higit pa: 20+ Pinakamahusay na Telegram AI Chatbots ng 2023

Sinulat niya iyon ChatGPT nasubok din, ngunit ang mga resulta ay umalis ng maraming naisin. Kamakailan ay nakakuha siya ng access sa mas matalino at mas updated na bersyon ng GPT modelo—GPT-4—at nagpasya na suriin kung magkakaroon ito ng mga katulad na resulta.

Ang eksperimento ay isinagawa tulad ng sumusunod: Ang mananaliksik ay lumikha ng isang teksto na naglalarawan sa gawain na kailangang tapusin ng neural network. Ipinost ng mananaliksik ang lahat sa mga komento: Ang senyas ay: “Bibigyan kita ng logic puzzle at apat na posibleng sagot; piliin ang isang tamang sagot mula sa kanila." Pagkatapos, para sa bawat pagsubok na tanong, lumikha si Ilya ng bagong dialog at ipinadala ang GPT-4 paglalarawan kasama ang teksto ng tanong. Natanggap ng bot ang tugon nang walang anumang pagwawasto o pahiwatig.

Mayroong 25 katanungan sa kabuuan, na may isang puntos na iginawad para sa bawat tamang sagot. Ayon sa istatistika, ang mga gumagamit ay nakakuha ng average na 13.6 puntos, na may median na hindi hihigit sa 14. Magkano ang GPT-4 makuha? Nakakuha ito ng 16 puntos!

Muli, nahihigitan ng neural network ang karaniwang tao sa lohikal na pangangatwiran. Ibig sabihin, nahihigitan nito ang karamihan sa mga taong nasubok. At ito ay pagkatapos isaalang-alang:

  • Ang pagsusulit ay isinagawa sa Russian, habang ang modelo ay pino para sa Ingles;
  • GPT-4, na ginagamit sa chat, ay hindi gaanong matalino kaysa sa hinalinhan nito (isang side effect ng mga etikal na paghihigpit).

Hiwalay, magpo-post kami ng mahusay na sagot sa tanong 22, kung saan ginamit ng neuron ang first-order logic upang makuha ang resulta sa matematika. Bagama't saklaw ito ng inilapat na matematika, hindi ito kurso sa unibersidad na kinukuha ng lahat.

Hiwalay, magpo-post kami ng mahusay na sagot sa tanong 22 kung saan ginamit ng neuron ang first-order na logic upang makuha ang resulta sa matematika. Alam nating lahat kung paano ito gawin sa inilapat na matematika pati na rin, ngunit ito ay isang karagdagang kurso sa unibersidad.

Naniniwala pa rin yan neural network ay isang uso? Una, subukang higitan ang pagganap GPT-4 (at ibahagi ang iyong mga resulta sa mga komento).

Magbasa pa tungkol sa AI:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

The DOGE Frenzy: Pagsusuri sa Kamakailang Pagtaas ng Halaga ng Dogecoin (DOGE).

Ang industriya ng cryptocurrency ay mabilis na lumalawak, at ang mga meme coins ay naghahanda para sa isang makabuluhang pagtaas. Dogecoin (DOGE), ...

Malaman Higit Pa

Ang Ebolusyon ng AI-Generated Content sa Metaverse

Ang paglitaw ng generative na nilalaman ng AI ay isa sa mga pinaka-kamangha-manghang pag-unlad sa loob ng virtual na kapaligiran ...

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Mga Nangungunang Deal ngayong Linggo, Mga Pangunahing Pamumuhunan sa AI, IT, Web3, at Crypto (22-26.04)
Digest Negosyo markets Teknolohiya
Mga Nangungunang Deal ngayong Linggo, Mga Pangunahing Pamumuhunan sa AI, IT, Web3, at Crypto (22-26.04)
Abril 26, 2024
Mga Komento ni Vitalik Buterin Tungkol sa Sentralisasyon Ng PoW, Mga Tala na Ito ay Pansamantalang Yugto Hanggang sa PoS
Ulat sa Balita Teknolohiya
Mga Komento ni Vitalik Buterin Tungkol sa Sentralisasyon Ng PoW, Mga Tala na Ito ay Pansamantalang Yugto Hanggang sa PoS
Abril 26, 2024
Inihayag ng Offchain Labs ang Pagtuklas ng Dalawang Kritikal na Kahinaan Sa Mga Patunay ng Panloloko ng OP Stack ng Optimism
Ulat sa Balita software Teknolohiya
Inihayag ng Offchain Labs ang Pagtuklas ng Dalawang Kritikal na Kahinaan Sa Mga Patunay ng Panloloko ng OP Stack ng Optimism
Abril 26, 2024
Ang Open Market ng Dymension Para sa Bridging Liquidity Mula sa RollApps eIBC Inilunsad Sa Mainnet
Ulat sa Balita Teknolohiya
Ang Open Market ng Dymension Para sa Bridging Liquidity Mula sa RollApps eIBC Inilunsad Sa Mainnet 
Abril 26, 2024
CRYPTOMERIA LABS PTE. LTD.