GPT-4 Berkinerja Lebih Baik Dibandingkan Orang Biasa dalam Tes Penalaran Logis, Klaim Studi
Singkatnya
Ilya Pestov, seorang peneliti AI Rusia, menciptakan tes berpikir logis yang diikuti oleh 12 ribu orang.
Dia baru-baru ini memperoleh akses ke yang lebih pintar GPT-4, dan melakukan eksperimen untuk melihat apakah kueri yang tepat dapat memberikan hasil.
Hasilnya menunjukkan bahwa GPT-4 mengungguli rata-rata orang dalam penalaran logis.
Ilya Pestov, seorang peneliti AI terkenal Rusia, memposting pesan di miliknya Saluran telegram tentang seberapa baik jaringan saraf menangani tes logis. Ilya pernah membuat @psylogicbot tes berpikir logis yang diikuti oleh kurang lebih 12 ribu orang. Anda dapat memeriksa statistik setelah mengikuti tes.
Baca lebih lanjut: 20+ Bot Obrolan AI Telegram Terbaik tahun 2023 |
Dia menulis itu ChatGPT juga telah diuji, tetapi hasilnya masih jauh dari yang diharapkan. Dia baru-baru ini mendapatkan akses ke versi yang lebih cerdas dan terbaru GPT model-GPT-4—Dan memutuskan untuk memeriksa apakah akan mendapatkan hasil yang serupa.
Eksperimen dilakukan sebagai berikut: Peneliti membuat teks yang menggambarkan tugas yang harus diselesaikan oleh jaringan saraf. Peneliti memposting semuanya di komentar: Permintaannya adalah: “Saya akan memberi Anda teka-teki logika dan empat kemungkinan jawaban; pilih satu jawaban yang benar dari mereka.” Kemudian, untuk setiap soal ujian, Ilya membuat dialog baru dan mengirimkannya GPT-4 deskripsi bersama dengan teks pertanyaan. Bot menerima respons tanpa koreksi atau petunjuk apa pun.
Ada total 25 pertanyaan, dengan satu poin diberikan untuk setiap jawaban yang benar. Menurut statistik, pengguna mendapat skor rata-rata 13.6 poin, dengan median tidak lebih dari 14. Berapa banyak skor yang diperoleh? GPT-4 mendapatkan? Ia berhasil mendapatkan 16 poin!
Sekali lagi, jaringan saraf mengungguli rata-rata orang dalam penalaran logis. Artinya, ini mengungguli mayoritas orang yang diuji. Dan ini setelah memperhitungkan:
- Pengujian dilakukan dalam bahasa Rusia, sedangkan modelnya disesuaikan untuk bahasa Inggris;
- GPT-4, yang digunakan dalam obrolan, kurang cerdas dibandingkan pendahulunya (efek samping dari pembatasan etika).
Secara terpisah, kami akan memposting jawaban yang sangat baik untuk pertanyaan 22, di mana neuron menggunakan logika orde pertama untuk mendapatkan hasil secara matematis. Meskipun ini tercakup dalam matematika terapan, ini bukanlah program universitas yang diambil semua orang.
Masih percaya itu jaringan saraf apakah itu iseng-iseng? Pertama, cobalah untuk mengungguli GPT-4 (dan bagikan hasil Anda di komentar).
Baca lebih lanjut tentang AI:
Penolakan tanggung jawab
Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.
Tentang Penulis
Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.
lebih artikelDamir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.