Novinky Technika
29. března 2023

GPT-4 Podává lepší výkon než průměrný člověk v testu logického uvažování, studie tvrzení

Stručně

Ilya Pestov, ruský výzkumník AI, vytvořil test logického myšlení, kterým prošlo 12 tisíc lidí.

Nedávno získal přístup k chytřejším GPT-4a provedli experiment, aby zjistili, zda by správný dotaz mohl přinést nějaké výsledky.

Výsledky ukázaly, že GPT-4 překonal průměrného člověka v logickém uvažování.

Ilja Pestov, známý ruský výzkumník umělé inteligence, na něj zveřejnil zprávu Telegramový kanál o tom, jak dobře neuronová síť zvládá logické testy. Ilya kdysi vytvořil @psychologickýbot test logického myšlení, který absolvovalo přibližně 12 tisíc lidí. Po provedení testu si můžete prohlédnout statistiky.

@Midjourney / Abdalla(hamoXX)#7378
Čtěte více: 20+ nejlepších telegramových AI chatbotů roku 2023

To napsal ChatGPT také byl testován, ale výsledky zůstaly hodně žádoucí. Nedávno získal přístup k chytřejší a aktualizovanější verzi GPT Modelka-GPT-4– a rozhodl se ověřit, zda by to mělo podobné výsledky.

Experiment probíhal následovně: Výzkumník vytvořil text, který popisoval úkol, který měla neuronová síť splnit. Výzkumník vše zveřejnil v komentářích: Výzva zněla: „Dám vám logickou hádanku a čtyři možné odpovědi; vyberte z nich jednu správnou odpověď." Poté pro každou testovou otázku vytvořil Ilja nový dialog a odeslal jej GPT-4 popis spolu s textem otázky. Robot obdržel odpověď bez jakýchkoli oprav nebo náznaků.

Celkem je 25 otázek, za každou správnou odpověď je udělen jeden bod. Podle statistik dosahují uživatelé v průměru 13.6 bodů, přičemž medián není větší než 14. GPT-4 dostat? Podařilo se mu získat 16 bodů!

Neuronová síť opět předčí průměrného člověka v logickém uvažování. To znamená, že překonává většinu testovaných lidí. A to po zohlednění:

  • Test byl proveden v ruštině, přičemž model je doladěn pro angličtinu;
  • GPT-4, který se používá v chatu, je méně inteligentní než jeho předchůdce (vedlejší efekt etických omezení).

Samostatně zveřejníme vynikající odpověď na otázku 22, ve které neuron použil logiku prvního řádu k matematickému odvození výsledku. I když to bylo zahrnuto v aplikované matematice, není to univerzitní kurz, který absolvuje každý.

Samostatně zveřejníme vynikající odpověď na otázku 22, ve které neuron použil logiku prvního řádu k matematickému odvození výsledku. Všichni jsme to uměli i v aplikované matematice, ale to byl doplňkový kurz na univerzitě.

Pořád tomu věř neuronové sítě jsou módní? Nejprve se snažte překonat GPT-4 (a podělte se o své výsledky v komentářích).

Přečtěte si více o AI:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Hot Stories
Připojte se k našemu zpravodaji.
Novinky

The DOGE Frenzy: Analýza nedávného nárůstu hodnoty dogecoinu (DOGE).

Odvětví kryptoměn se rychle rozrůstá a meme coiny se připravují na výrazný vzestup. Dogecoin (DOGE),...

Vědět více

Vývoj obsahu generovaného umělou inteligencí v Metaverse

Vznik generativního obsahu umělé inteligence je jedním z nejvíce fascinujících pokroků ve virtuálním prostředí...

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Nejlepší nabídky tohoto týdne, velké investice do AI, IT, Web3a kryptoměny (22-26.04)
Strávit Business Trhy Technika
Nejlepší nabídky tohoto týdne, velké investice do AI, IT, Web3a kryptoměny (22-26.04)
26. dubna 2024
Vitalik Buterin komentuje centralizaci PoW a poznamenává, že to byla dočasná fáze do PoS
Novinky Technika
Vitalik Buterin komentuje centralizaci PoW a poznamenává, že to byla dočasná fáze do PoS
26. dubna 2024
Offchain Labs odhaluje objev dvou kritických zranitelností v důkazech o podvodech OP Stack společnosti Optimism
Novinky Vývoj Technika
Offchain Labs odhaluje objev dvou kritických zranitelností v důkazech o podvodech OP Stack společnosti Optimism
26. dubna 2024
Otevřený trh společnosti Dymension pro překlenutí likvidity z RollApps eIBC se spouští v síti Mainnet
Novinky Technika
Otevřený trh společnosti Dymension pro překlenutí likvidity z RollApps eIBC se spouští v síti Mainnet 
26. dubna 2024
CRYPTOMERIA LABS PTE. LTD.