GPT-4 Podává lepší výkon než průměrný člověk v testu logického uvažování, studie tvrzení
Stručně
Ilya Pestov, ruský výzkumník AI, vytvořil test logického myšlení, kterým prošlo 12 tisíc lidí.
Nedávno získal přístup k chytřejším GPT-4a provedli experiment, aby zjistili, zda by správný dotaz mohl přinést nějaké výsledky.
Výsledky ukázaly, že GPT-4 překonal průměrného člověka v logickém uvažování.
Ilja Pestov, známý ruský výzkumník umělé inteligence, na něj zveřejnil zprávu Telegramový kanál o tom, jak dobře neuronová síť zvládá logické testy. Ilya kdysi vytvořil @psychologickýbot test logického myšlení, který absolvovalo přibližně 12 tisíc lidí. Po provedení testu si můžete prohlédnout statistiky.
To napsal ChatGPT také byl testován, ale výsledky zůstaly hodně žádoucí. Nedávno získal přístup k chytřejší a aktualizovanější verzi GPT Modelka-GPT-4– a rozhodl se ověřit, zda by to mělo podobné výsledky.
Experiment probíhal následovně: Výzkumník vytvořil text, který popisoval úkol, který měla neuronová síť splnit. Výzkumník vše zveřejnil v komentářích: Výzva zněla: „Dám vám logickou hádanku a čtyři možné odpovědi; vyberte z nich jednu správnou odpověď." Poté pro každou testovou otázku vytvořil Ilja nový dialog a odeslal jej GPT-4 popis spolu s textem otázky. Robot obdržel odpověď bez jakýchkoli oprav nebo náznaků.
Celkem je 25 otázek, za každou správnou odpověď je udělen jeden bod. Podle statistik dosahují uživatelé v průměru 13.6 bodů, přičemž medián není větší než 14. GPT-4 dostat? Podařilo se mu získat 16 bodů!
Neuronová síť opět předčí průměrného člověka v logickém uvažování. To znamená, že překonává většinu testovaných lidí. A to po zohlednění:
- Test byl proveden v ruštině, přičemž model je doladěn pro angličtinu;
- GPT-4, který se používá v chatu, je méně inteligentní než jeho předchůdce (vedlejší efekt etických omezení).
Samostatně zveřejníme vynikající odpověď na otázku 22, ve které neuron použil logiku prvního řádu k matematickému odvození výsledku. I když to bylo zahrnuto v aplikované matematice, není to univerzitní kurz, který absolvuje každý.
Pořád tomu věř neuronové sítě jsou módní? Nejprve se snažte překonat GPT-4 (a podělte se o své výsledky v komentářích).
Přečtěte si více o AI:
Odmítnutí odpovědnosti
V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.
O autorovi
Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu.
Další článkyDamir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu.