Haber Raporu Teknoloji
15 Mart, 2023

GPT-4 Mağazasından GPT-3.5 Çeşitli Çalışma Karşılaştırmalarına İlişkin Genel Bakış

Kısaca

The GPT-4 göre daha yüksek bir not eşiğine ulaştı. GPT-3Çeşitli kıyaslamalarda 5.

Bu, makinelerin yalnızca insan benzeri zeka yeteneğine sahip olmadığını, aynı zamanda bizden daha iyi performans gösterebileceğini gösterdiği için büyük bir başarıdır, bu da yapay zekanın geleceği ve iş piyasası üzerindeki potansiyel etkisi hakkında soru işaretleri uyandırır.

GPT-4 mevcut büyük dil modellerinin yanı sıra ek eğitim protokolleri veya karşılaştırmaya özel tasarım kullananlar da dahil olmak üzere son teknoloji ürünü (SOTA) modellere göre önemli ölçüde daha iyi performans göstermektedir.

The GPT-4 göre daha yüksek puanlar elde etmiştir. GPT-3Çeşitli kıyaslamalarda 5. Bu, makineler için büyük bir atılımdır çünkü makinelerin artık yalnızca orijinal olarak tasarlanmış sorunları çözmekle kalmayıp, aynı zamanda bunu üniversite öğrencilerinden daha iyi çözebildiklerini de kanıtlamaktadır.

GPT-4 Mağazasından GPT-3.5 çeşitli çalışma kriterlerinde genel olarak

Bu sonuca bakarken dikkate alınması gereken birkaç şey var. İlk olarak, GPT-4 Bu sınavlara yönelik özel bir eğitim verilmedi. Kamuya açık en yeni testleri (Olimpiyatlar ve AP ücretsiz yanıtlı sorular durumunda) kullanarak veya deneme sınavlarının 2022-2023 sürümlerini satın alarak ilerledi. İkinci olarak şunu belirtmekte fayda var. GPT-4Farklı prensipler ve algoritmalar üzerinde çalıştığı için performansı, sınava giren insanların yeteneklerini yansıtmayabilir.

olarak bu büyük bir başarıdır gösteriyor makinelerin yalnızca insan benzeri zekaya sahip olmadığını, aynı zamanda bizden daha iyi performans gösterebileceğini de. Bu, makinelerin giderek daha karmaşık görevleri üstlenebileceği ve sonuçta bize günlük hayatımızda yardımcı olabilecekleri bir geleceğin yolunu açıyor.

The GPT-4Bazı görevlerde insanlardan daha iyi performans gösterebilme yeteneği, geleceğin geleceği hakkında soruları gündeme getiriyor yapay zeka ve iş piyasası üzerindeki potansiyel etkisi. Ayrıca, AI'nın etik ve sorumlu bir şekilde kullanılmasını sağlamak için bu alanda sürekli araştırma ve geliştirme ihtiyacını vurgulamaktadır.
Daha fazla oku: 5'ün En Çok Beklenen 2023+ Metinden Görüntüye Yapay Zeka modeli

GPT-4örneğin, sınava girenlerin ilk %10'u arasında yer alan bir puanla simüle edilmiş bir baro sınavını geçer; GPT-35'in puanı en alttaki %10'daydı. Bu önemli iyileşme GPT-4Performansı, daha büyük eğitim verilerinden ve geliştirilmiş mimarisinden kaynaklanmaktadır. Doğal dil işleme ve otomatik yazma da dahil olmak üzere çeşitli alanlarda geniş bir uygulama yelpazesine sahip olması bekleniyor.

 
GPT-4 Bu profesyonel ve akademik sınavların çoğunda insan düzeyinde performans sergiliyor. Özellikle, Tekdüzen Çubuk Sınavının simüle edilmiş bir versiyonunu, sınava girenlerin ilk% 10'u arasında bir puan alarak geçti. Modelin sınavlara ilişkin yeteneklerinin öncelikle eğitim öncesi süreçten kaynaklandığı ve RLHF'den önemli ölçüde etkilenmediği görülmektedir. Çoktan seçmeli sorularda hem temel GPT-4 modeli ve RLHF modeli, test edilen sınavın geliştiricileri arasında ortalama olarak eşit derecede iyi performans gösterdi.

Mevcut büyük modellerin yanı sıra ek eğitim protokolleri veya karşılaştırmalı değerlendirmeye özel tasarım kullanabilenler de dahil olmak üzere son teknoloji (SOTA) modellerin çoğu dil modelleri, önemli ölçüde daha iyi performans gösteriyor GPT-4.

GPT-4akademik standartlar açısından performansı. Geliştiricilerin kontrastı GPT-4 LM tarafından değerlendirilen birkaç atış için en iyi SOTA'nın yanı sıra karşılaştırmaya özel eğitime sahip en iyi SOTA ile. DROP hariç, GPT-4 kıyaslamaya özel eğitim ile tüm kıyaslamalarda ve SOTA'da mevcut tüm LM'lerden daha iyi performans gösteriyor.

Dahili olarak geliştiriciler şunu kullanıyor: GPT-4programlama, satış, destek ve içerik denetimi gibi faaliyetler üzerinde önemli bir etkisi oldu. Hizalama yöntemimizin ikinci aşaması şu anda devam ediyor; geliştiriciler bunu insanlara yapay zeka sonuçlarını gözden geçirmede yardımcı olmak için kullanıyor.

MMLU (Massive Multi-Task Language Learning) veri seti, farklı görevlerde (matematik, biyoloji, hukuk, sosyal ve beşeri bilimler, vb. dahil olmak üzere 57 alanı kapsayan) dilin anlaşılmasına ilişkin çok çeşitli konulardan sorular içerir. Sorunun biri doğru olmak üzere dört olası yanıtı vardır. Yani rastgele tahmin, %25 doğru cevap sonucunu gösterir. Soru örnekleri ve zorlukları için aşağıdaki resme bakın. Ortalama bir kişi-belirteç (yani, bu bir bilim adamı değil, bir profesör değil - işaretleme olarak ek iş yapan sıradan bir kişi) soruların% 35'ini doğru yanıtlıyor; ancak uzmanlar +/- %90'lık bir puana ulaşabilirler.

Performansı GPT-4 MMLU'daki İngilizce'deki önceki modellerle karşılaştırıldığında çeşitli dillerde. GPT-4 Letonca, Galce ve Svahili gibi düşük kaynaklı diller de dahil olmak üzere, incelenen dillerin büyük çoğunluğu için mevcut dil modellerinin İngilizce dil performansını aşmaktadır.
Daha fazla oku: Google Üzerinden Yapay Zeka Destekli Bing Kullanmak İçin 5 Neden

Başlangıçta veri kümesinin tamamı İngilizceydi. Peki ya sorular ve cevaplar diğer dillere, özellikle de daha az yaygın olanlara çevrilirse? Model bir şekilde onların işine yarayacak mı? Bu testte çeviri için Microsoft Azure Translate hizmeti kullanıldı. Çeviriler mükemmel değildir; bazı durumlarda önemli bilgiler kaybolur. Ancak bu durumda dahi GPT-4 diğer dillerde iyi performans gösterir. MMLU'nun çevrilmiş versiyonlarında, GPT-4 İncelenen 24 dilin 26'ünde diğer büyük modellerin (Google'ınki dahil) İngilizce seviyesinden daha iyi performans göstermektedir.

Daha ne, GPT-4 nadir dillerde olduğundan daha iyi performans gösterir ChatGPT İngilizce yaptım (ChatGPT %70.1 puan alırken, yeni modelin Tayland için puanı %71.8 oldu. İngilizce sınavında en yüksek puan elde edildi GPT-4 Google'ın en büyük PaLM'si de dahil olmak üzere diğer modellerden %10 daha iyi performans gösteriyor. Uzmanlardan oluşan bir grup ise %86.4'lık bir skor elde ederken %90'lük bir puan elde etti.

  • 2023 yazına kadar yapay zeka yeni bir güç düzeyine ulaşmış olabilir. ChatGPTkullanan bir sohbet robotu GPT-4 algoritma ve Mağazasından GPT-3 570 katına kadar. Çeşitli unsurlar katkıda bulunur ChatGPTdaha "insana benzer" tasarımı ve etkinliğini ve doğruluğunu artırmak için en son veri madenciliği ve doğal dil işlemeyi kullanması da dahil olmak üzere başarısı.
  • Microsoft ve OpenAI Ocak ayında işbirliklerini yenilediklerini ve Bing aramanın yapay zekayla geliştirilmiş arama yeteneklerini benimseme planlarını duyurdu. Çok sofistike GPT3.5 modelinin değiştirilmesi, GPT4, yeni başlatıldıve Bing aramanın doğal dil sorgularını anlama ve daha doğru sonuçlar verme kapasitesini büyük ölçüde geliştirme potansiyeline sahiptir. Bir şeylerin ters gitmesi durumunda iyi bir yedekleme planına sahip olmak iyi bir fikirdir.

Daha fazla ilgili haber okuyun:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Daha fazla haber
Damir Yalalov
Damir Yalalov

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Hot Stories
Bültenimize Katılın.
En Yeni Haberler

Volatilite Ortasında Bitcoin ETF'lerine Yönelik Kurumsal İştah Artıyor

13F başvuruları aracılığıyla yapılan açıklamalar, önemli kurumsal yatırımcıların Bitcoin ETF'leriyle uğraştığını ortaya koyuyor ve Bitcoin ETF'lerinin artan bir şekilde kabul edildiğinin altını çiziyor.

bilmek Daha

Hüküm Günü Geliyor: ABD Mahkemesi Adalet Bakanlığı'nın Savunmasını Değerlendirirken CZ'nin Kaderi Dengede

Changpeng Zhao bugün Seattle'daki bir ABD mahkemesinde cezayla karşı karşıya kalmaya hazırlanıyor.

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
Injective, inEVM'ye Yeniden Bağlantı Güvenliği Getirmek İçin AltLayer ile Güçlerini Birleştiriyor
İşletme Haber Raporu Teknoloji
Injective, inEVM'ye Yeniden Bağlantı Güvenliği Getirmek İçin AltLayer ile Güçlerini Birleştiriyor
Mayıs 3, 2024
Masa, MASA Borç Verme Havuzunu Tanıtmak İçin Teller ile İşbirliği Yapıyor, Temelde USDC Borçlanmasını Sağlıyor
Piyasalar Haber Raporu Teknoloji
Masa, MASA Borç Verme Havuzunu Tanıtmak İçin Teller ile İşbirliği Yapıyor, Temelde USDC Borçlanmasını Sağlıyor
Mayıs 3, 2024
Velodrome Önümüzdeki Haftalarda Superchain Beta Sürümünü Piyasaya Sürüyor ve OP Yığın Katmanı 2 Blok Zincirlerine Genişliyor
Piyasalar Haber Raporu Teknoloji
Velodrome Önümüzdeki Haftalarda Superchain Beta Sürümünü Piyasaya Sürüyor ve OP Yığın Katmanı 2 Blok Zincirlerine Genişliyor
Mayıs 3, 2024
CARV, Veri Katmanını Merkezi Olmayan Hale Getirmek ve Ödülleri Dağıtmak İçin Aethir ile Ortaklığını Duyurdu
İşletme Haber Raporu Teknoloji
CARV, Veri Katmanını Merkezi Olmayan Hale Getirmek ve Ödülleri Dağıtmak İçin Aethir ile Ortaklığını Duyurdu
Mayıs 3, 2024
CRYPTOMERIA LABS PTE. LTD.