Laporan berita Teknologi
29 Maret, 2023

GPT-4 Berkinerja Lebih Baik Dibandingkan Orang Biasa dalam Tes Penalaran Logis, Klaim Studi

Singkatnya

Ilya Pestov, seorang peneliti AI Rusia, menciptakan tes berpikir logis yang diikuti oleh 12 ribu orang.

Dia baru-baru ini memperoleh akses ke yang lebih pintar GPT-4, dan melakukan eksperimen untuk melihat apakah kueri yang tepat dapat memberikan hasil.

Hasilnya menunjukkan bahwa GPT-4 mengungguli rata-rata orang dalam penalaran logis.

Ilya Pestov, seorang peneliti AI terkenal Rusia, memposting pesan di miliknya Saluran telegram tentang seberapa baik jaringan saraf menangani tes logis. Ilya pernah membuat @psylogicbot tes berpikir logis yang diikuti oleh kurang lebih 12 ribu orang. Anda dapat memeriksa statistik setelah mengikuti tes.

@Midjourney / Abdalla(hamoXX)#7378
Baca lebih lanjut: 20+ Bot Obrolan AI Telegram Terbaik tahun 2023

Dia menulis itu ChatGPT juga telah diuji, tetapi hasilnya masih jauh dari yang diharapkan. Dia baru-baru ini mendapatkan akses ke versi yang lebih cerdas dan terbaru GPT model-GPT-4—Dan memutuskan untuk memeriksa apakah akan mendapatkan hasil yang serupa.

Eksperimen dilakukan sebagai berikut: Peneliti membuat teks yang menggambarkan tugas yang harus diselesaikan oleh jaringan saraf. Peneliti memposting semuanya di komentar: Permintaannya adalah: “Saya akan memberi Anda teka-teki logika dan empat kemungkinan jawaban; pilih satu jawaban yang benar dari mereka.” Kemudian, untuk setiap soal ujian, Ilya membuat dialog baru dan mengirimkannya GPT-4 deskripsi bersama dengan teks pertanyaan. Bot menerima respons tanpa koreksi atau petunjuk apa pun.

Ada total 25 pertanyaan, dengan satu poin diberikan untuk setiap jawaban yang benar. Menurut statistik, pengguna mendapat skor rata-rata 13.6 poin, dengan median tidak lebih dari 14. Berapa banyak skor yang diperoleh? GPT-4 mendapatkan? Ia berhasil mendapatkan 16 poin!

Sekali lagi, jaringan saraf mengungguli rata-rata orang dalam penalaran logis. Artinya, ini mengungguli mayoritas orang yang diuji. Dan ini setelah memperhitungkan:

  • Pengujian dilakukan dalam bahasa Rusia, sedangkan modelnya disesuaikan untuk bahasa Inggris;
  • GPT-4, yang digunakan dalam obrolan, kurang cerdas dibandingkan pendahulunya (efek samping dari pembatasan etika).

Secara terpisah, kami akan memposting jawaban yang sangat baik untuk pertanyaan 22, di mana neuron menggunakan logika orde pertama untuk mendapatkan hasil secara matematis. Meskipun ini tercakup dalam matematika terapan, ini bukanlah program universitas yang diambil semua orang.

Secara terpisah, kami akan memposting jawaban yang sangat baik untuk pertanyaan 22 di mana neuron menggunakan logika orde pertama untuk mendapatkan hasil secara matematis. Kami semua juga tahu bagaimana melakukannya dalam matematika terapan, tetapi itu adalah mata kuliah tambahan di universitas.

Masih percaya itu jaringan saraf apakah itu iseng-iseng? Pertama, cobalah untuk mengungguli GPT-4 (dan bagikan hasil Anda di komentar).

Baca lebih lanjut tentang AI:

Penolakan tanggung jawab

Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.

Tentang Penulis

Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah. 

lebih artikel
Damir Yalalov
Damir Yalalov

Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah. 

Hot Stories
Bergabunglah dengan Buletin Kami.
Berita Terkini

Kegilaan DOGE: Menganalisis Lonjakan Nilai Dogecoin (DOGE) Baru-baru ini

Industri mata uang kripto berkembang pesat, dan koin meme sedang bersiap untuk peningkatan yang signifikan. Dogecoin (DOGE), ...

Tahu lebih banyak

Evolusi Konten Buatan AI di Metaverse

Munculnya konten AI generatif adalah salah satu perkembangan paling menarik dalam lingkungan virtual ...

Tahu lebih banyak
Bergabunglah dengan Komunitas Teknologi Inovatif Kami
Baca Selengkapnya
Baca lebih lanjut
Penawaran Teratas Minggu Ini, Investasi Besar dalam AI, IT, Web3, dan Kripto (22-26.04)
intisari Bisnis pasar Teknologi
Penawaran Teratas Minggu Ini, Investasi Besar dalam AI, IT, Web3, dan Kripto (22-26.04)
26 April, 2024
Vitalik Buterin Mengomentari Sentralisasi PoW, Catatan Itu Tahap Sementara Hingga PoS
Laporan berita Teknologi
Vitalik Buterin Mengomentari Sentralisasi PoW, Catatan Itu Tahap Sementara Hingga PoS
26 April, 2024
Offchain Labs Mengungkapkan Penemuan Dua Kerentanan Kritis Dalam Bukti Penipuan OP Stack Optimisme
Laporan berita Perangkat lunak Teknologi
Offchain Labs Mengungkapkan Penemuan Dua Kerentanan Kritis Dalam Bukti Penipuan OP Stack Optimisme
26 April, 2024
Pasar Terbuka Dymension Untuk Menjembatani Likuiditas Dari RollApps eIBC Diluncurkan Di Mainnet
Laporan berita Teknologi
Pasar Terbuka Dymension Untuk Menjembatani Likuiditas Dari RollApps eIBC Diluncurkan Di Mainnet 
26 April, 2024