Raport aktualności Technologia
29 marca 2023 r.

GPT-4 Badanie twierdzi, że wypada lepiej niż przeciętna osoba w teście logicznego rozumowania

W skrócie

Ilya Pestov, rosyjski badacz AI, stworzył test logicznego myślenia, który zdało 12 tysięcy osób.

Niedawno uzyskał dostęp do mądrzejszych GPT-4i przeprowadził eksperyment, aby sprawdzić, czy właściwe zapytanie może dać pewne wyniki.

Wyniki pokazały, że GPT-4 przewyższał przeciętnego człowieka w logicznym rozumowaniu.

Ilya Pestov, znany rosyjski badacz AI, opublikował wiadomość na swoim Kanał telegramu o tym, jak dobrze sieć neuronowa radzi sobie z testami logicznymi. Ilya kiedyś stworzyła @psychologbot testu logicznego myślenia, do którego przystąpiło ok. 12 tys. osób. Możesz sprawdzić statystyki po wykonaniu testu.

@Midjourney / Abdalla(hamoXX)#7378
Czytaj więcej: Ponad 20 najlepszych chatbotów Telegram AI w 2023 r

Napisał to ChatGPT też się przebadałam, ale wyniki pozostawiają wiele do życzenia. Niedawno uzyskał dostęp do inteligentniejszej i bardziej aktualnej wersji programu GPT Model-GPT-4— i postanowiłem sprawdzić, czy przyniesie podobne rezultaty.

Eksperyment przeprowadzono w następujący sposób: Badacz stworzył tekst opisujący zadanie, które miała wykonać sieć neuronowa. Badacz zamieścił wszystko w komentarzach: Podpowiedź brzmiała: „Dam ci zagadkę logiczną i cztery możliwe odpowiedzi; wybierz spośród nich jedną poprawną odpowiedź”. Następnie dla każdego pytania testowego Ilya tworzyła nowe okno dialogowe i wysyłała GPT-4 opis wraz z treścią pytania. Bot otrzymał odpowiedź bez żadnych poprawek ani podpowiedzi.

W sumie jest 25 pytań, a za każdą poprawną odpowiedź przyznawany jest jeden punkt. Według statystyk użytkownicy uzyskują średnio 13.6 punktów, przy medianie nie większej niż 14. Ile GPT-4 Dostawać? Udało się zdobyć 16 punktów!

Po raz kolejny sieć neuronowa przewyższa przeciętnego człowieka w logicznym rozumowaniu. Oznacza to, że przewyższa większość testowanych osób. A to po uwzględnieniu:

  • Test został przeprowadzony w języku rosyjskim, podczas gdy model jest dostosowany do języka angielskiego;
  • GPT-4, który jest używany na czacie, jest mniej inteligentny niż jego poprzednik (efekt uboczny ograniczeń etycznych).

Osobno opublikujemy doskonałą odpowiedź na pytanie 22, w której neuron wykorzystał logikę pierwszego rzędu, aby wyprowadzić wynik matematycznie. Chociaż było to omówione w matematyce stosowanej, nie jest to kurs uniwersytecki, na który wszyscy uczęszczają.

Oddzielnie opublikujemy doskonałą odpowiedź na pytanie 22, w której neuron użył logiki pierwszego rzędu, aby uzyskać wynik matematycznie. Wszyscy wiedzieliśmy, jak to zrobić również w matematyce stosowanej, ale był to dodatkowy przedmiot na uniwersytecie.

Nadal w to wierz sieci neuronowe są modą? Najpierw spróbuj wyprzedzić innych GPT-4 (i podziel się wynikami w komentarzach).

Przeczytaj więcej o sztucznej inteligencji:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Więcej artykułów
Damir Jałałow
Damir Jałałow

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Hot Stories
Dołącz do naszego newslettera.
Najnowsze wieści

Szał DOGE: analiza niedawnego wzrostu wartości Dogecoina (DOGE).

Branża kryptowalut szybko się rozwija, a monety memowe przygotowują się na znaczny wzrost. Dogecoin (DOGE), ...

Dowiedz się więcej

Ewolucja treści generowanych przez sztuczną inteligencję w Metaverse

Pojawienie się generatywnych treści AI jest jednym z najbardziej fascynujących osiągnięć w środowisku wirtualnym…

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Najlepsze oferty tego tygodnia, duże inwestycje w sztuczną inteligencję, IT, Web3i Krypto (22-26.04)
Digest Biznes rynki Technologia
Najlepsze oferty tego tygodnia, duże inwestycje w sztuczną inteligencję, IT, Web3i Krypto (22-26.04)
26 kwietnia 2024 r.
Vitalik Buterin komentuje centralizację PoW, zauważa, że ​​był to etap tymczasowy do czasu PoS
Raport aktualności Technologia
Vitalik Buterin komentuje centralizację PoW, zauważa, że ​​był to etap tymczasowy do czasu PoS
26 kwietnia 2024 r.
Offchain Labs ujawnia dwie krytyczne luki w dowodach oszustwa OP Stack Optymizmu
Raport aktualności Tworzenie Technologia
Offchain Labs ujawnia dwie krytyczne luki w dowodach oszustwa OP Stack Optymizmu
26 kwietnia 2024 r.
Otwarty rynek firmy Dymension zapewniający płynność dzięki RollApps eIBC zostaje uruchomiony w sieci głównej
Raport aktualności Technologia
Otwarty rynek firmy Dymension zapewniający płynność dzięki RollApps eIBC zostaje uruchomiony w sieci głównej 
26 kwietnia 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.