Ziņojums Tehnoloģija
Marts 29, 2023

GPT-4 Izpētes apgalvojumi, loģiskā spriešanas testā darbojas labāk nekā vidusmēra cilvēks

Īsumā

Krievu MI pētnieks Iļja Pestovs izveidoja loģiskās domāšanas testu, kuru nokārtoja 12 tūkstoši cilvēku.

Viņš nesen ieguva piekļuvi gudrākam GPT-4, un veica eksperimentu, lai noskaidrotu, vai pareizais vaicājums var dot dažus rezultātus.

Rezultāti parādīja, ka GPT-4 loģiskā spriešanā pārspēja vidusmēra cilvēku.

Pazīstamais krievu mākslīgā intelekta pētnieks Iļja Pestovs savā vietnē ievietoja ziņojumu Telegrammas kanāls par to, cik labi neironu tīkls apstrādā loģiskos testus. Iļja savulaik radīja @psylogicbot loģiskās domāšanas tests, kuru kārtoja aptuveni 12 tūkstoši cilvēku. Pēc testa veikšanas varat skatīt statistiku.

@Midjourney / Abdalla(hamoXX)#7378
Lasīt vairāk: 20+ 2023. gada labākie Telegram AI tērzēšanas roboti

Viņš to rakstīja ChatGPT arī tika pārbaudīts, bet rezultāti atstāja daudz ko vēlēties. Viņš nesen ieguva piekļuvi viedākai un atjauninātākai versijai GPT modelis -GPT-4— un nolēma pārbaudīt, vai tas iegūs līdzīgus rezultātus.

Eksperiments tika veikts šādi: pētnieks izveidoja tekstu, kurā aprakstīts uzdevums, kas neironu tīklam bija jāizpilda. Pētnieks komentāros ievietoja visu: Uzvedne bija: “Es jums iedošu loģisko mīklu un četras iespējamās atbildes; izvēlieties no tiem vienu pareizo atbildi." Pēc tam katram testa jautājumam Iļja izveidoja jaunu dialoglodziņu un nosūtīja GPT-4 apraksts kopā ar jautājuma tekstu. Bots saņēma atbildi bez jebkādiem labojumiem vai mājieniem.

Kopumā ir 25 jautājumi, par katru pareizo atbildi tiek piešķirts viens punkts. Saskaņā ar statistiku, lietotāji vidēji iegūst 13.6 punktus, bet vidēji ne vairāk kā 14. Cik GPT-4 gūt? Tā izdevās iegūt 16 punktus!

Atkal neironu tīkls pārspēj vidusmēra cilvēku loģiskajā spriešanā. Tas nozīmē, ka tas pārspēj lielāko daļu pārbaudīto cilvēku. Un tas ir, ņemot vērā:

  • Tests tika veikts krievu valodā, savukārt modelis ir precīzi noregulēts angļu valodai;
  • GPT-4, kas tiek izmantots tērzēšanā, ir mazāk inteliģents nekā tā priekšgājējs (ētisku ierobežojumu blakusparādība).

Atsevišķi mēs ievietosim lielisku atbildi uz 22. jautājumu, kurā neirons izmantoja pirmās kārtas loģiku, lai matemātiski iegūtu rezultātu. Lai gan tas tika apskatīts lietišķajā matemātikā, tas nav universitātes kurss, ko visi apmeklē.

Atsevišķi mēs ievietosim lielisku atbildi uz 22. jautājumu, kurā neirons izmantoja pirmās kārtas loģiku, lai matemātiski iegūtu rezultātu. Visi pratām to darīt arī lietišķajā matemātikā, bet tas bija papildus kurss augstskolā.

Joprojām tici tam neironu tīkli ir iedoma? Pirmkārt, mēģiniet pārspēt GPT-4 (un kopīgojiet savus rezultātus komentāros).

Lasiet vairāk par AI:

Atbildības noraidīšana

Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.

Par Autors

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Vairāk rakstus
Damirs Jalalovs
Damirs Jalalovs

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Hot Stories
Pievienojieties mūsu informatīvajam izdevumam.
Jaunākās ziņas

DOGE Frenzy: analizējot Dogecoin (DOGE) neseno vērtības pieaugumu

Kriptovalūtu industrija strauji paplašinās, un mēmu monētas gatavojas ievērojamam augšupejam. Dogecoin (DOGE), ...

Uzziniet vairāk

AI radītā satura evolūcija metaversā

Ģeneratīvā AI satura parādīšanās ir viens no aizraujošākajiem notikumiem virtuālajā vidē ...

Uzziniet vairāk
Pievienojieties mūsu novatoriskajai tehnoloģiju kopienai
Lasīt vairāk
Vairāk
Šīs nedēļas labākie piedāvājumi, lielie ieguldījumi AI, IT, Web3un Kripto (22-26.04)
Sagremot bizness Markets Tehnoloģija
Šīs nedēļas labākie piedāvājumi, lielie ieguldījumi AI, IT, Web3un Kripto (22-26.04)
Aprīlis 26, 2024
Vitaliks Buterins komentē PoW centralizāciju, atzīmē, ka tas bija pagaidu posms līdz izlaidumam
Ziņojums Tehnoloģija
Vitaliks Buterins komentē PoW centralizāciju, atzīmē, ka tas bija pagaidu posms līdz izlaidumam
Aprīlis 26, 2024
Offchain Labs atklāj divas kritiskas ievainojamības Optimisma OP Stack krāpšanas pierādījumos
Ziņojums programmatūra Tehnoloģija
Offchain Labs atklāj divas kritiskas ievainojamības Optimisma OP Stack krāpšanas pierādījumos
Aprīlis 26, 2024
Dymension atvērtais tirgus likviditātes nodrošināšanai no RollApps eIBC tiek palaists galvenajā tīklā
Ziņojums Tehnoloģija
Dymension atvērtais tirgus likviditātes nodrošināšanai no RollApps eIBC tiek palaists galvenajā tīklā 
Aprīlis 26, 2024
CRYPTOMERIA LABS PTE. LTD.