Laporan Berita Teknologi
Mac 29, 2023

GPT-4 Berprestasi Lebih Baik Daripada Orang Biasa pada Ujian Penaakulan Logik, Tuntutan Kajian

Secara ringkas

Ilya Pestov, seorang penyelidik AI Rusia, mencipta ujian pemikiran logik, yang diluluskan oleh 12 ribu orang.

Dia baru-baru ini mendapat akses kepada yang lebih pintar GPT-4, dan menjalankan percubaan untuk melihat sama ada pertanyaan yang betul boleh menghasilkan beberapa keputusan.

Keputusan menunjukkan bahawa GPT-4 mengatasi orang biasa dalam penaakulan logik.

Ilya Pestov, seorang penyelidik AI Rusia yang terkenal, menyiarkan mesej padanya Saluran Telegram tentang sejauh mana rangkaian saraf mengendalikan ujian logik. Ilya pernah mencipta @psylogicbot ujian pemikiran logik, yang telah diambil oleh kira-kira 12 ribu orang. Anda boleh menyemak statistik selepas mengambil ujian.

@Midjourney / Abdalla(hamoXX)#7378
Baca lebih lanjut: 20+ Telegram AI Chatbots Terbaik 2023

Dia menulis itu ChatGPT juga telah diuji, tetapi hasilnya meninggalkan banyak yang diinginkan. Baru-baru ini dia mendapat akses kepada versi yang lebih pintar dan terkini GPT model—GPT-4—dan memutuskan untuk menyemak sama ada ia akan mendapat hasil yang serupa.

Eksperimen telah dijalankan seperti berikut: Pengkaji mencipta teks yang menerangkan tugas yang perlu diselesaikan oleh rangkaian saraf. Penyelidik menyiarkan segala-galanya dalam ulasan: Gesaannya ialah: “Saya akan memberikan anda teka-teki logik dan empat jawapan yang mungkin; pilih satu jawapan yang betul daripada mereka.” Kemudian, untuk setiap soalan ujian, Ilya mencipta dialog baharu dan menghantar GPT-4 penerangan beserta teks soalan. Bot menerima respons tanpa sebarang pembetulan atau petunjuk.

Terdapat 25 soalan secara keseluruhan, dengan satu mata diberikan untuk setiap jawapan yang betul. Menurut statistik, pengguna mendapat 13.6 mata secara purata, dengan median tidak lebih daripada 14. Berapa banyak GPT-4 dapat? Ia berjaya mendapat 16 mata!

Sekali lagi, rangkaian saraf mengatasi orang biasa dalam penaakulan logik. Iaitu, ia mengatasi majoriti orang yang diuji. Dan ini selepas mengambil kira:

  • Ujian itu dijalankan dalam bahasa Rusia, manakala modelnya diperhalusi untuk bahasa Inggeris;
  • GPT-4, yang digunakan dalam sembang, adalah kurang pintar berbanding pendahulunya (kesan sampingan sekatan etika).

Secara berasingan, kami akan menyiarkan jawapan yang sangat baik untuk soalan 22, di mana neuron menggunakan logik urutan pertama untuk memperoleh keputusan secara matematik. Walaupun ini diliputi dalam matematik gunaan, ia bukanlah kursus universiti yang diambil oleh semua orang.

Secara berasingan, kami akan menyiarkan jawapan yang sangat baik untuk soalan 22 di mana neuron menggunakan logik urutan pertama untuk memperoleh keputusan secara matematik. Kita semua tahu bagaimana melakukannya dalam matematik gunaan juga, tetapi ia adalah kursus tambahan di universiti.

Masih percaya itu rangkaian saraf adalah satu trend? Pertama, cuba untuk mengatasi prestasi GPT-4 (dan kongsikan hasil anda dalam komen).

Baca lebih lanjut mengenai AI:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Selera Institusi Berkembang Terhadap Bitcoin ETF Di Tengah-tengah Kemeruapan

Pendedahan melalui pemfailan 13F mendedahkan pelabur institusi terkenal yang berkecimpung dalam Bitcoin ETF, menekankan penerimaan yang semakin meningkat terhadap ...

Mengetahui lebih lanjut

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Lebih Lanjut
Maklumat Lanjut
Peralihan Donald Trump kepada Kripto: Daripada Lawan kepada Peguambela, dan Apa Maknanya untuk Pasaran Mata Wang Kripto AS
Perniagaan pasaran Cerita dan Ulasan Teknologi
Peralihan Donald Trump kepada Kripto: Daripada Lawan kepada Peguambela, dan Apa Maknanya untuk Pasaran Mata Wang Kripto AS
Semoga 10, 2024
Layer3 Untuk Melancarkan Token L3 Musim Panas Ini, Memperuntukkan 51% Daripada Jumlah Bekalan Kepada Komuniti
pasaran Laporan Berita Teknologi
Layer3 Untuk Melancarkan Token L3 Musim Panas Ini, Memperuntukkan 51% Daripada Jumlah Bekalan Kepada Komuniti
Semoga 10, 2024
Amaran Terakhir Edward Snowden kepada Pemaju Bitcoin: “Jadikan Privasi sebagai Keutamaan Tahap Protokol atau Risiko Kehilangannya
pasaran Keselamatan Wiki perisian Cerita dan Ulasan Teknologi
Amaran Terakhir Edward Snowden kepada Pemaju Bitcoin: “Jadikan Privasi sebagai Keutamaan Tahap Protokol atau Risiko Kehilangannya
Semoga 10, 2024
Pudina Rangkaian Lapisan 2 Ethereum Dikuasakan Optimisme Untuk Melancarkan Mainnetnya Pada 15 Mei
Laporan Berita Teknologi
Pudina Rangkaian Lapisan 2 Ethereum Dikuasakan Optimisme Untuk Melancarkan Mainnetnya Pada 15 Mei
Semoga 10, 2024