Laporan Berita Teknologi
Mac 29, 2023

GPT-4 Berprestasi Lebih Baik Daripada Orang Biasa pada Ujian Penaakulan Logik, Tuntutan Kajian

Secara ringkas

Ilya Pestov, seorang penyelidik AI Rusia, mencipta ujian pemikiran logik, yang diluluskan oleh 12 ribu orang.

Dia baru-baru ini mendapat akses kepada yang lebih pintar GPT-4, dan menjalankan percubaan untuk melihat sama ada pertanyaan yang betul boleh menghasilkan beberapa keputusan.

Keputusan menunjukkan bahawa GPT-4 mengatasi orang biasa dalam penaakulan logik.

Ilya Pestov, seorang penyelidik AI Rusia yang terkenal, menyiarkan mesej padanya Saluran Telegram tentang sejauh mana rangkaian saraf mengendalikan ujian logik. Ilya pernah mencipta @psylogicbot ujian pemikiran logik, yang telah diambil oleh kira-kira 12 ribu orang. Anda boleh menyemak statistik selepas mengambil ujian.

@Midjourney / Abdalla(hamoXX)#7378
Baca lebih lanjut: 20+ Telegram AI Chatbots Terbaik 2023

Dia menulis itu ChatGPT juga telah diuji, tetapi hasilnya meninggalkan banyak yang diinginkan. Baru-baru ini dia mendapat akses kepada versi yang lebih pintar dan terkini GPT model—GPT-4—dan memutuskan untuk menyemak sama ada ia akan mendapat hasil yang serupa.

Eksperimen telah dijalankan seperti berikut: Pengkaji mencipta teks yang menerangkan tugas yang perlu diselesaikan oleh rangkaian saraf. Penyelidik menyiarkan segala-galanya dalam ulasan: Gesaannya ialah: “Saya akan memberikan anda teka-teki logik dan empat jawapan yang mungkin; pilih satu jawapan yang betul daripada mereka.” Kemudian, untuk setiap soalan ujian, Ilya mencipta dialog baharu dan menghantar GPT-4 penerangan beserta teks soalan. Bot menerima respons tanpa sebarang pembetulan atau petunjuk.

Terdapat 25 soalan secara keseluruhan, dengan satu mata diberikan untuk setiap jawapan yang betul. Menurut statistik, pengguna mendapat 13.6 mata secara purata, dengan median tidak lebih daripada 14. Berapa banyak GPT-4 dapat? Ia berjaya mendapat 16 mata!

Sekali lagi, rangkaian saraf mengatasi orang biasa dalam penaakulan logik. Iaitu, ia mengatasi majoriti orang yang diuji. Dan ini selepas mengambil kira:

  • Ujian itu dijalankan dalam bahasa Rusia, manakala modelnya diperhalusi untuk bahasa Inggeris;
  • GPT-4, yang digunakan dalam sembang, adalah kurang pintar berbanding pendahulunya (kesan sampingan sekatan etika).

Secara berasingan, kami akan menyiarkan jawapan yang sangat baik untuk soalan 22, di mana neuron menggunakan logik urutan pertama untuk memperoleh keputusan secara matematik. Walaupun ini diliputi dalam matematik gunaan, ia bukanlah kursus universiti yang diambil oleh semua orang.

Secara berasingan, kami akan menyiarkan jawapan yang sangat baik untuk soalan 22 di mana neuron menggunakan logik urutan pertama untuk memperoleh keputusan secara matematik. Kita semua tahu bagaimana melakukannya dalam matematik gunaan juga, tetapi ia adalah kursus tambahan di universiti.

Masih percaya itu rangkaian saraf adalah satu trend? Pertama, cuba untuk mengatasi prestasi GPT-4 (dan kongsikan hasil anda dalam komen).

Baca lebih lanjut mengenai AI:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Hot Stories
Sertai Surat Berita Kami.
Berita Terkini

Kegilaan DOGE: Menganalisis Lonjakan Nilai Terkini Dogecoin (DOGE).

Industri mata wang kripto berkembang pesat, dan syiling meme sedang bersedia untuk peningkatan yang ketara. Dogecoin (DOGE), ...

Mengetahui lebih lanjut

Evolusi Kandungan Dijana AI dalam Metaverse

Kemunculan kandungan AI generatif adalah salah satu perkembangan yang paling menarik dalam persekitaran maya ...

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Untuk Lebih Lanjut
Baca lagi
Tawaran Teratas Minggu Ini, Pelaburan Utama dalam AI, IT, Web3, dan Kripto (22-26.04)
Digest Perniagaan pasaran Teknologi
Tawaran Teratas Minggu Ini, Pelaburan Utama dalam AI, IT, Web3, dan Kripto (22-26.04)
April 26, 2024
Vitalik Buterin Mengulas Mengenai Pemusatan PoW, Perhatikan Ia Adalah Peringkat Sementara Sehingga PoS
Laporan Berita Teknologi
Vitalik Buterin Mengulas Mengenai Pemusatan PoW, Perhatikan Ia Adalah Peringkat Sementara Sehingga PoS
April 26, 2024
Offchain Labs Mendedahkan Penemuan Dua Kerentanan Kritikal Dalam Bukti Penipuan OP Stack Optimism
Laporan Berita perisian Teknologi
Offchain Labs Mendedahkan Penemuan Dua Kerentanan Kritikal Dalam Bukti Penipuan OP Stack Optimism
April 26, 2024
Pasaran Terbuka Dymension Untuk Merapatkan Kecairan Daripada RollApps eIBC Dilancarkan Di Mainnet
Laporan Berita Teknologi
Pasaran Terbuka Dymension Untuk Merapatkan Kecairan Daripada RollApps eIBC Dilancarkan Di Mainnet 
April 26, 2024