Novice Tehnologija
Marec 29, 2023

GPT-4 Deluje bolje kot povprečna oseba na preizkusu logičnega sklepanja, trdijo študije

Na kratko

Ilya Pestov, ruski raziskovalec AI, je ustvaril test logičnega razmišljanja, ki ga je opravilo 12 tisoč ljudi.

Nedavno je dobil dostop do pametnejšega GPT-4, in izvedel poskus, da bi ugotovil, ali lahko prava poizvedba prinese nekaj rezultatov.

Rezultati so pokazali, da je GPT-4 presegel povprečnega človeka v logičnem sklepanju.

Ilya Pestov, znani ruski raziskovalec AI, je objavil sporočilo na svojem Telegram kanal o tem, kako dobro nevronska mreža obravnava logične teste. Ilya je nekoč ustvaril @psylogicbot preizkus logičnega razmišljanja, ki ga je reševalo približno 12 tisoč ljudi. Po opravljenem testu lahko preverite statistiko.

@Midjourney / Abdalla(hamoXX)#7378
Preberite več: 20+ najboljših klepetalnih robotov Telegram AI v letu 2023

To je napisal ChatGPT je bil tudi testiran, vendar so bili rezultati precej nezaželeni. Nedavno je dobil dostop do pametnejše in posodobljene različice GPT model—GPT-4– in se odločil preveriti, ali bo dobil podobne rezultate.

Poskus je bil izveden na naslednji način: Raziskovalec je ustvaril besedilo, ki je opisovalo nalogo, ki jo mora nevronska mreža opraviti. Raziskovalec je vse objavil v komentarjih: Poziv je bil: »Dam vam logično uganko in štiri možne odgovore; med njimi izberite enega pravilnega odgovora.« Nato je Ilya za vsako testno vprašanje ustvaril novo pogovorno okno in poslal GPT-4 opis skupaj z besedilom vprašanja. Bot je prejel odgovor brez popravkov ali namigov.

Vseh vprašanj je 25, za vsak pravilen odgovor pa se dodeli ena točka. Po statističnih podatkih uporabniki v povprečju dosežejo 13.6 točke, mediana pa ne presega 14. GPT-4 dobiti? Uspelo je dobiti 16 točk!

Še enkrat, nevronska mreža prekaša povprečnega človeka v logičnem sklepanju. To pomeni, da prekaša večino testiranih ljudi. In to po upoštevanju:

  • Test je bil izveden v ruščini, medtem ko je model natančno prilagojen za angleščino;
  • GPT-4, ki se uporablja v klepetu, je manj inteligenten kot njegov predhodnik (stranski učinek etičnih omejitev).

Ločeno bomo objavili odličen odgovor na vprašanje 22, v katerem je nevron uporabil logiko prvega reda za matematično izpeljavo rezultata. Čeprav je bilo to zajeto v uporabni matematiki, to ni univerzitetni predmet, ki bi ga obiskovali vsi.

Ločeno bomo objavili odličen odgovor na vprašanje 22, v katerem je nevron uporabil logiko prvega reda za matematično izpeljavo rezultata. Vsi smo to znali delati tudi pri uporabni matematiki, vendar je bil to dodaten predmet na fakulteti.

Še vedno verjamem v to nevronske mreže so modna muha? Najprej poskusite preseči GPT-4 (in delite svoje rezultate v komentarjih).

Preberite več o AI:

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

več člankov
Damir Yalalov
Damir Yalalov

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

Institucionalni apetit raste proti Bitcoin ETF-jem sredi volatilnosti

Razkritja prek vlog 13F razkrivajo pomembne institucionalne vlagatelje, ki se ukvarjajo z Bitcoin ETF, kar poudarja vse večje sprejemanje ...

Več o tem

Prihaja dan obsodbe: usoda CZ visi na ravnovesju, ko ameriško sodišče obravnava tožbeni razlog DOJ

Changpeng Zhao se danes sooča z obsodbo na ameriškem sodišču v Seattlu.

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
NuLink se zažene na Bybitu Web3 Platforma IDO. Faza naročnine se podaljša do 13. maja
Prisotnost Novice Tehnologija
NuLink se zažene na Bybitu Web3 Platforma IDO. Faza naročnine se podaljša do 13. maja
Maj 9, 2024
UXLINK in Binance sodelujeta pri novi kampanji in uporabnikom ponujata 20 milijonov točk UXUY in Airdrop Nagrade
Prisotnost Novice Tehnologija
UXLINK in Binance sodelujeta pri novi kampanji in uporabnikom ponujata 20 milijonov točk UXUY in Airdrop Nagrade
Maj 9, 2024
Side Protocol zažene Incentivized Testnet in uvede sistem notranjih točk, ki uporabnikom omogoča, da si prislužijo SIDE točke
Prisotnost Novice Tehnologija
Side Protocol zažene Incentivized Testnet in uvede sistem notranjih točk, ki uporabnikom omogoča, da si prislužijo SIDE točke
Maj 9, 2024
Web3 in kripto dogodki v maju 2024: Raziskovanje novih tehnologij in nastajajočih trendov v verigi blokov in DeFi
prebaviti ŽELITE POSTATI PARTNER Prisotnost Tehnologija
Web3 in kripto dogodki v maju 2024: Raziskovanje novih tehnologij in nastajajočih trendov v verigi blokov in DeFi
Maj 9, 2024
CRYPTOMERIA LABS PTE. LTD.