Haber Raporu Teknoloji
29 Mart, 2023

GPT-4 Mantıksal Muhakeme Testinde Ortalama Bir Kişiden Daha İyi Performans Gösteriyor, Çalışma İddiaları

Kısaca

Rus yapay zeka araştırmacısı Ilya Pestov, 12 bin kişinin geçtiği mantıksal düşünme testini oluşturdu.

Yakın zamanda daha akıllı olanlara erişim elde etti GPT-4ve doğru sorgunun bazı sonuçlar getirip getiremeyeceğini görmek için bir deney gerçekleştirdik.

Sonuçlar gösterdi ki, GPT-4 Mantıksal akıl yürütmede ortalama bir insanı geride bıraktı.

Tanınmış bir Rus AI araştırmacısı olan Ilya Pestov, hesabında bir mesaj yayınladı. Telegram kanalı sinir ağının mantıksal testleri ne kadar iyi yaptığı hakkında. Ilya bir kez yarattı @psylogicbot yaklaşık 12 bin kişinin katıldığı mantıksal düşünme testi. Testi yaptıktan sonra istatistikleri kontrol edebilirsiniz.

@Midjourney / Abdullah(hamoXX)#7378
Daha fazla oku: 20'ün En İyi 2023+ Telegram Yapay Zeka Sohbet Robotu

Bunu yazdı ChatGPT ayrıca test edildi, ancak sonuçlar arzulanan çok şey bıraktı. Yakın zamanda uygulamanın daha akıllı ve daha güncel versiyonuna erişim sağladı. GPT modeli—GPT-4—ve benzer sonuçlar elde edip etmeyeceğini kontrol etmeye karar verdi.

Deney şu şekilde gerçekleştirildi: Araştırmacı, sinir ağının tamamlaması gereken görevi açıklayan bir metin oluşturdu. Araştırmacı yorumlarda her şeyi yayınladı: İstem şuydu: “Size bir mantık bulmacası ve dört olası cevap vereceğim; onlardan bir doğru cevabı seçin.” Ardından, her test sorusu için İlya yeni bir iletişim kutusu oluşturdu ve GPT-4 soru metni ile birlikte açıklama. Bot, yanıtı herhangi bir düzeltme veya ipucu olmadan aldı.

Toplamda 25 soru vardır ve her doğru cevaba bir puan verilir. İstatistiklere göre kullanıcılar ortalama 13.6 puan alıyor ve ortalama 14'ü geçmiyor. GPT-4 elde etmek? 16 puan almayı başardı!

Bir kez daha, sinir ağı mantıksal akıl yürütmede ortalama bir insanı geride bırakıyor. Yani, test edilen insanların çoğundan daha iyi performans gösteriyor. Ve bu dikkate aldıktan sonra:

  • Test, modelde İngilizce için ince ayar yapılırken Rusça olarak gerçekleştirildi;
  • GPT-4Sohbette kullanılan önceki sürüme göre daha az akıllıdır (etik kısıtlamaların bir yan etkisi).

Ayrı olarak, nöronun sonucu matematiksel olarak türetmek için birinci dereceden mantığı kullandığı 22. soruya mükemmel bir cevap yayınlayacağız. Bu, uygulamalı matematikte kapsanırken, herkesin aldığı bir üniversite dersi değildir.

Ayrı olarak, nöronun sonucu matematiksel olarak türetmek için birinci dereceden mantığı kullandığı 22. soruya mükemmel bir cevap yayınlayacağız. Uygulamalı matematikte de hepimiz biliyorduk ama üniversitede ek dersti.

Hala buna inanıyorum nöral ağlar bir moda mı? İlk önce daha iyi performans göstermeye çalışın GPT-4 (ve sonuçlarınızı yorumlarda paylaşın).

AI hakkında daha fazlasını okuyun:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Daha fazla haber
Damir Yalalov
Damir Yalalov

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

DOGE Çılgınlığı: Dogecoin'in (DOGE) Son Zamanlardaki Değer Artışını Analiz Etmek

Kripto para endüstrisi hızla genişliyor ve meme paraları önemli bir yükselişe hazırlanıyor. Dogecoin (DOGE),...

bilmek Daha

Metaevrende Yapay Zeka Tarafından Üretilen İçeriğin Evrimi

Üretken AI içeriğinin ortaya çıkışı, sanal ortamdaki en büyüleyici gelişmelerden biridir ...

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
Dymension'ın RollApps'ten Likiditeyi Köprülemeye Yönelik Açık Pazarı eIBC Mainnet'te Başlatılıyor
Haber Raporu Teknoloji
Dymension'ın RollApps'ten Likiditeyi Köprülemeye Yönelik Açık Pazarı eIBC Mainnet'te Başlatılıyor 
26 Nisan 2024
Chivo Cüzdan İhlali Konusunda Hükümetin Sessizliği Eleştirilere ve El Salvador'un Bitcoin Deneyine İlişkin Şüphelere Yol Açtı
Güvenlik Wiki Software Hikayeler ve İncelemeler Teknoloji
Chivo Cüzdan İhlali Konusunda Hükümetin Sessizliği Eleştirilere ve El Salvador'un Bitcoin Deneyine İlişkin Şüphelere Yol Açtı
26 Nisan 2024
2024'ün En İyi On Altcoin'i: 2024'ün En İyilerine Dalış
Software Hikayeler ve İncelemeler Teknoloji
2024'ün En İyi On Altcoin'i: 2024'ün En İyilerine Dalış
26 Nisan 2024
Merkezi Kontrol mü, Merkezi Olmayan Yönetişim mi? Ethereum'un Staking Politikası Tartışmasını Anlamak
Software Hikayeler ve İncelemeler Teknoloji
Merkezi Kontrol mü, Merkezi Olmayan Yönetişim mi? Ethereum'un Staking Politikası Tartışmasını Anlamak
26 Nisan 2024
CRYPTOMERIA LABS PTE. LTD.