GPT-4 Badanie twierdzi, że wypada lepiej niż przeciętna osoba w teście logicznego rozumowania
W skrócie
Ilya Pestov, rosyjski badacz AI, stworzył test logicznego myślenia, który zdało 12 tysięcy osób.
Niedawno uzyskał dostęp do mądrzejszych GPT-4i przeprowadził eksperyment, aby sprawdzić, czy właściwe zapytanie może dać pewne wyniki.
Wyniki pokazały, że GPT-4 przewyższał przeciętnego człowieka w logicznym rozumowaniu.
Ilya Pestov, znany rosyjski badacz AI, opublikował wiadomość na swoim Kanał telegramu o tym, jak dobrze sieć neuronowa radzi sobie z testami logicznymi. Ilya kiedyś stworzyła @psychologbot testu logicznego myślenia, do którego przystąpiło ok. 12 tys. osób. Możesz sprawdzić statystyki po wykonaniu testu.
Czytaj więcej: Ponad 20 najlepszych chatbotów Telegram AI w 2023 r |
Napisał to ChatGPT też się przebadałam, ale wyniki pozostawiają wiele do życzenia. Niedawno uzyskał dostęp do inteligentniejszej i bardziej aktualnej wersji programu GPT Model-GPT-4— i postanowiłem sprawdzić, czy przyniesie podobne rezultaty.
Eksperyment przeprowadzono w następujący sposób: Badacz stworzył tekst opisujący zadanie, które miała wykonać sieć neuronowa. Badacz zamieścił wszystko w komentarzach: Podpowiedź brzmiała: „Dam ci zagadkę logiczną i cztery możliwe odpowiedzi; wybierz spośród nich jedną poprawną odpowiedź”. Następnie dla każdego pytania testowego Ilya tworzyła nowe okno dialogowe i wysyłała GPT-4 opis wraz z treścią pytania. Bot otrzymał odpowiedź bez żadnych poprawek ani podpowiedzi.
W sumie jest 25 pytań, a za każdą poprawną odpowiedź przyznawany jest jeden punkt. Według statystyk użytkownicy uzyskują średnio 13.6 punktów, przy medianie nie większej niż 14. Ile GPT-4 Dostawać? Udało się zdobyć 16 punktów!
Po raz kolejny sieć neuronowa przewyższa przeciętnego człowieka w logicznym rozumowaniu. Oznacza to, że przewyższa większość testowanych osób. A to po uwzględnieniu:
- Test został przeprowadzony w języku rosyjskim, podczas gdy model jest dostosowany do języka angielskiego;
- GPT-4, który jest używany na czacie, jest mniej inteligentny niż jego poprzednik (efekt uboczny ograniczeń etycznych).
Osobno opublikujemy doskonałą odpowiedź na pytanie 22, w której neuron wykorzystał logikę pierwszego rzędu, aby wyprowadzić wynik matematycznie. Chociaż było to omówione w matematyce stosowanej, nie jest to kurs uniwersytecki, na który wszyscy uczęszczają.
Nadal w to wierz sieci neuronowe są modą? Najpierw spróbuj wyprzedzić innych GPT-4 (i podziel się wynikami w komentarzach).
Przeczytaj więcej o sztucznej inteligencji:
Odpowiedzialność
Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.
O autorze
Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.
Więcej artykułówDamir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.