Novinová správa Technológia
March 29, 2023

GPT-4 Podáva lepšie výsledky ako priemerný človek v teste logického uvažovania, štúdie tvrdení

Stručne

Ilya Pestov, ruský výskumník AI, vytvoril test logického myslenia, ktorým prešlo 12 tisíc ľudí.

Nedávno získal prístup k inteligentnejším GPT-4a vykonali experiment, aby zistili, či správny dopyt môže priniesť nejaké výsledky.

Výsledky ukázali, že GPT-4 prekonali priemerného človeka v logickom uvažovaní.

Iľja Pestov, známy ruský výskumník AI, zverejnil správu Kanál telegramu o tom, ako dobre zvláda neurónová sieť logické testy. Ilya raz vytvoril @psychologicbot test logického myslenia, ktorý absolvovalo približne 12 tisíc ľudí. Po vykonaní testu si môžete pozrieť štatistiky.

@Midjourney / Abdalla(hamoXX)#7378
Prečítajte si viac: 20+ najlepších telegramových AI chatbotov roku 2023

Napísal to ChatGPT boli tiež testované, ale výsledky zostali veľa, čo bolo potrebné. Nedávno získal prístup k inteligentnejšej a aktualizovanejšej verzii GPT Model-GPT-4-a rozhodol sa skontrolovať, či by to malo podobné výsledky.

Experiment prebiehal nasledovne: Výskumník vytvoril text, ktorý popisoval úlohu, ktorú mala neurónová sieť splniť. Výskumník všetko zverejnil v komentároch: Výzva znela: „Dám vám logickú hádanku a štyri možné odpovede; vyberte z nich jednu správnu odpoveď." Potom pre každú testovaciu otázku Ilya vytvoril nový dialóg a odoslal ho GPT-4 popis spolu s textom otázky. Robot dostal odpoveď bez akýchkoľvek opráv alebo náznakov.

Celkovo je 25 otázok, pričom za každú správnu odpoveď je udelený jeden bod. Podľa štatistík dosahujú používatelia v priemere 13.6 bodu, pričom medián nie je vyšší ako 14. Koľko GPT-4 dostať? Podarilo sa mu získať 16 bodov!

Neurónová sieť opäť predčí bežného človeka v logickom uvažovaní. To znamená, že prevyšuje väčšinu testovaných ľudí. A to po zohľadnení:

  • Test prebiehal v ruštine, pričom model je doladený pre angličtinu;
  • GPT-4, ktorý sa používa v chate, je menej inteligentný ako jeho predchodca (vedľajší efekt etických obmedzení).

Samostatne uverejníme vynikajúcu odpoveď na otázku 22, v ktorej neurón použil logiku prvého poriadku na matematické odvodenie výsledku. Hoci to bolo zahrnuté v aplikovanej matematike, nie je to univerzitný kurz, ktorý absolvuje každý.

Samostatne uverejníme vynikajúcu odpoveď na otázku 22, v ktorej neurón použil logiku prvého poriadku na matematické odvodenie výsledku. Všetci sme to vedeli robiť aj z aplikovanej matematiky, ale to bol doplnkový kurz na vysokej škole.

Stále tomu ver neurálne siete sú móda? Najprv sa pokúste prekonať GPT-4 (a podeľte sa o svoje výsledky v komentároch).

Prečítajte si viac o AI:

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Ďalšie články
Damir Yalalov
Damir Yalalov

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Hot Stories
Pridajte sa k nášmu newsletteru.
Novinky

DOGE Frenzy: Analýza nedávneho nárastu hodnoty dogecoinu (DOGE).

Odvetvie kryptomien sa rýchlo rozširuje a meme coiny sa pripravujú na výrazný vzostup. Dogecoin (DOGE),...

vedieť viac

Vývoj obsahu generovaného AI v Metaverse

Vznik generatívneho obsahu AI je jedným z najfascinujúcejších objavov vo virtuálnom prostredí...

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
Najlepšie ponuky tohto týždňa, hlavné investície do AI, IT, Web3a kryptomeny (22-26.04)
výťah firmy trhy Technológia
Najlepšie ponuky tohto týždňa, hlavné investície do AI, IT, Web3a kryptomeny (22-26.04)
Apríla 26, 2024
Vitalik Buterin komentuje centralizáciu PoW a poznamenáva, že to bolo dočasné štádium až do PoS
Novinová správa Technológia
Vitalik Buterin komentuje centralizáciu PoW a poznamenáva, že to bolo dočasné štádium až do PoS
Apríla 26, 2024
Offchain Labs odhaľuje objav dvoch kritických zraniteľností v dôkazoch o podvodoch OP Stack Optimism
Novinová správa Softvér Technológia
Offchain Labs odhaľuje objav dvoch kritických zraniteľností v dôkazoch o podvodoch OP Stack Optimism
Apríla 26, 2024
Otvorený trh spoločnosti Dymension na premostenie likvidity z RollApps eIBC sa spúšťa na sieti Mainnet
Novinová správa Technológia
Otvorený trh spoločnosti Dymension na premostenie likvidity z RollApps eIBC sa spúšťa na sieti Mainnet 
Apríla 26, 2024
CRYPTOMERIA LABS PTE. LTD.