GPT-4 Berprestasi Lebih Baik Daripada Orang Biasa pada Ujian Penaakulan Logik, Tuntutan Kajian
Secara ringkas
Ilya Pestov, seorang penyelidik AI Rusia, mencipta ujian pemikiran logik, yang diluluskan oleh 12 ribu orang.
Dia baru-baru ini mendapat akses kepada yang lebih pintar GPT-4, dan menjalankan percubaan untuk melihat sama ada pertanyaan yang betul boleh menghasilkan beberapa keputusan.
Keputusan menunjukkan bahawa GPT-4 mengatasi orang biasa dalam penaakulan logik.
Ilya Pestov, seorang penyelidik AI Rusia yang terkenal, menyiarkan mesej padanya Saluran Telegram tentang sejauh mana rangkaian saraf mengendalikan ujian logik. Ilya pernah mencipta @psylogicbot ujian pemikiran logik, yang telah diambil oleh kira-kira 12 ribu orang. Anda boleh menyemak statistik selepas mengambil ujian.
Baca lebih lanjut: 20+ Telegram AI Chatbots Terbaik 2023 |
Dia menulis itu ChatGPT juga telah diuji, tetapi hasilnya meninggalkan banyak yang diinginkan. Baru-baru ini dia mendapat akses kepada versi yang lebih pintar dan terkini GPT model—GPT-4—dan memutuskan untuk menyemak sama ada ia akan mendapat hasil yang serupa.
Eksperimen telah dijalankan seperti berikut: Pengkaji mencipta teks yang menerangkan tugas yang perlu diselesaikan oleh rangkaian saraf. Penyelidik menyiarkan segala-galanya dalam ulasan: Gesaannya ialah: “Saya akan memberikan anda teka-teki logik dan empat jawapan yang mungkin; pilih satu jawapan yang betul daripada mereka.” Kemudian, untuk setiap soalan ujian, Ilya mencipta dialog baharu dan menghantar GPT-4 penerangan beserta teks soalan. Bot menerima respons tanpa sebarang pembetulan atau petunjuk.
Terdapat 25 soalan secara keseluruhan, dengan satu mata diberikan untuk setiap jawapan yang betul. Menurut statistik, pengguna mendapat 13.6 mata secara purata, dengan median tidak lebih daripada 14. Berapa banyak GPT-4 dapat? Ia berjaya mendapat 16 mata!
Sekali lagi, rangkaian saraf mengatasi orang biasa dalam penaakulan logik. Iaitu, ia mengatasi majoriti orang yang diuji. Dan ini selepas mengambil kira:
- Ujian itu dijalankan dalam bahasa Rusia, manakala modelnya diperhalusi untuk bahasa Inggeris;
- GPT-4, yang digunakan dalam sembang, adalah kurang pintar berbanding pendahulunya (kesan sampingan sekatan etika).
Secara berasingan, kami akan menyiarkan jawapan yang sangat baik untuk soalan 22, di mana neuron menggunakan logik urutan pertama untuk memperoleh keputusan secara matematik. Walaupun ini diliputi dalam matematik gunaan, ia bukanlah kursus universiti yang diambil oleh semua orang.
Masih percaya itu rangkaian saraf adalah satu trend? Pertama, cuba untuk mengatasi prestasi GPT-4 (dan kongsikan hasil anda dalam komen).
Baca lebih lanjut mengenai AI:
Penafian
Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.
Tentang Pengarang
Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.
lebih banyak artikelDamir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.