Novinky Technika
29. března 2023

GPT-4 Podává lepší výkon než průměrný člověk v testu logického uvažování, studie tvrzení

Stručně

Ilya Pestov, ruský výzkumník AI, vytvořil test logického myšlení, kterým prošlo 12 tisíc lidí.

Nedávno získal přístup k chytřejším GPT-4a provedli experiment, aby zjistili, zda by správný dotaz mohl přinést nějaké výsledky.

Výsledky ukázaly, že GPT-4 překonal průměrného člověka v logickém uvažování.

Ilja Pestov, známý ruský výzkumník umělé inteligence, na něj zveřejnil zprávu Telegramový kanál o tom, jak dobře neuronová síť zvládá logické testy. Ilya kdysi vytvořil @psychologickýbot test logického myšlení, který absolvovalo přibližně 12 tisíc lidí. Po provedení testu si můžete prohlédnout statistiky.

@Midjourney / Abdalla(hamoXX)#7378
Čtěte více: 20+ nejlepších telegramových AI chatbotů roku 2023

To napsal ChatGPT také byl testován, ale výsledky zůstaly hodně žádoucí. Nedávno získal přístup k chytřejší a aktualizovanější verzi GPT Modelka-GPT-4– a rozhodl se ověřit, zda by to mělo podobné výsledky.

Experiment probíhal následovně: Výzkumník vytvořil text, který popisoval úkol, který měla neuronová síť splnit. Výzkumník vše zveřejnil v komentářích: Výzva zněla: „Dám vám logickou hádanku a čtyři možné odpovědi; vyberte z nich jednu správnou odpověď." Poté pro každou testovou otázku vytvořil Ilja nový dialog a odeslal jej GPT-4 popis spolu s textem otázky. Robot obdržel odpověď bez jakýchkoli oprav nebo náznaků.

Celkem je 25 otázek, za každou správnou odpověď je udělen jeden bod. Podle statistik dosahují uživatelé v průměru 13.6 bodů, přičemž medián není větší než 14. GPT-4 dostat? Podařilo se mu získat 16 bodů!

Neuronová síť opět předčí průměrného člověka v logickém uvažování. To znamená, že překonává většinu testovaných lidí. A to po zohlednění:

  • Test byl proveden v ruštině, přičemž model je doladěn pro angličtinu;
  • GPT-4, který se používá v chatu, je méně inteligentní než jeho předchůdce (vedlejší efekt etických omezení).

Samostatně zveřejníme vynikající odpověď na otázku 22, ve které neuron použil logiku prvního řádu k matematickému odvození výsledku. I když to bylo zahrnuto v aplikované matematice, není to univerzitní kurz, který absolvuje každý.

Samostatně zveřejníme vynikající odpověď na otázku 22, ve které neuron použil logiku prvního řádu k matematickému odvození výsledku. Všichni jsme to uměli i v aplikované matematice, ale to byl doplňkový kurz na univerzitě.

Pořád tomu věř neuronové sítě jsou módní? Nejprve se snažte překonat GPT-4 (a podělte se o své výsledky v komentářích).

Přečtěte si více o AI:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Notcoin plánuje distribuovat 5 % své dodávky tokenů 500,000 XNUMX členům komunity a uživatelům krypto burzy
Trhy Novinky Technika
Notcoin plánuje distribuovat 5 % své dodávky tokenů 500,000 XNUMX členům komunity a uživatelům krypto burzy
13
Posun Donalda Trumpa ke kryptoměnám: od oponenta k obhájci a co to znamená pro americký trh s kryptoměnami
Business Trhy Příběhy a recenze Technika
Posun Donalda Trumpa ke kryptoměnám: od oponenta k obhájci a co to znamená pro americký trh s kryptoměnami
10
Layer3 spustí letos v létě token L3 a přidělí komunitě 51 % celkové dodávky
Trhy Novinky Technika
Layer3 spustí letos v létě token L3 a přidělí komunitě 51 % celkové dodávky
10
Poslední varování Edwarda Snowdena pro vývojáře bitcoinů: „Udělejte ze soukromí prioritu na úrovni protokolu nebo riskujte jeho ztrátu
Trhy Bezpečnost Wiki Vývoj Příběhy a recenze Technika
Poslední varování Edwarda Snowdena pro vývojáře bitcoinů: „Udělejte ze soukromí prioritu na úrovni protokolu nebo riskujte jeho ztrátu
10
CRYPTOMERIA LABS PTE. LTD.