GPT-4 Podáva lepšie výsledky ako priemerný človek v teste logického uvažovania, štúdie tvrdení
Stručne
Ilya Pestov, ruský výskumník AI, vytvoril test logického myslenia, ktorým prešlo 12 tisíc ľudí.
Nedávno získal prístup k inteligentnejším GPT-4a vykonali experiment, aby zistili, či správny dopyt môže priniesť nejaké výsledky.
Výsledky ukázali, že GPT-4 prekonali priemerného človeka v logickom uvažovaní.
Iľja Pestov, známy ruský výskumník AI, zverejnil správu Kanál telegramu o tom, ako dobre zvláda neurónová sieť logické testy. Ilya raz vytvoril @psychologicbot test logického myslenia, ktorý absolvovalo približne 12 tisíc ľudí. Po vykonaní testu si môžete pozrieť štatistiky.
Prečítajte si viac: 20+ najlepších telegramových AI chatbotov roku 2023 |
Napísal to ChatGPT boli tiež testované, ale výsledky zostali veľa, čo bolo potrebné. Nedávno získal prístup k inteligentnejšej a aktualizovanejšej verzii GPT Model-GPT-4-a rozhodol sa skontrolovať, či by to malo podobné výsledky.
Experiment prebiehal nasledovne: Výskumník vytvoril text, ktorý popisoval úlohu, ktorú mala neurónová sieť splniť. Výskumník všetko zverejnil v komentároch: Výzva znela: „Dám vám logickú hádanku a štyri možné odpovede; vyberte z nich jednu správnu odpoveď." Potom pre každú testovaciu otázku Ilya vytvoril nový dialóg a odoslal ho GPT-4 popis spolu s textom otázky. Robot dostal odpoveď bez akýchkoľvek opráv alebo náznakov.
Celkovo je 25 otázok, pričom za každú správnu odpoveď je udelený jeden bod. Podľa štatistík dosahujú používatelia v priemere 13.6 bodu, pričom medián nie je vyšší ako 14. Koľko GPT-4 dostať? Podarilo sa mu získať 16 bodov!
Neurónová sieť opäť predčí bežného človeka v logickom uvažovaní. To znamená, že prevyšuje väčšinu testovaných ľudí. A to po zohľadnení:
- Test prebiehal v ruštine, pričom model je doladený pre angličtinu;
- GPT-4, ktorý sa používa v chate, je menej inteligentný ako jeho predchodca (vedľajší efekt etických obmedzení).
Samostatne uverejníme vynikajúcu odpoveď na otázku 22, v ktorej neurón použil logiku prvého poriadku na matematické odvodenie výsledku. Hoci to bolo zahrnuté v aplikovanej matematike, nie je to univerzitný kurz, ktorý absolvuje každý.
Stále tomu ver neurálne siete sú móda? Najprv sa pokúste prekonať GPT-4 (a podeľte sa o svoje výsledky v komentároch).
Prečítajte si viac o AI:
Vylúčenie zodpovednosti
V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.
O autorovi
Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu.
Ďalšie článkyDamir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu.