GPT-4 Mağazasından GPT-3.5 Çeşitli Çalışma Karşılaştırmalarına İlişkin Genel Bakış
Kısaca
The GPT-4 göre daha yüksek bir not eşiğine ulaştı. GPT-3Çeşitli kıyaslamalarda 5.
Bu, makinelerin yalnızca insan benzeri zeka yeteneğine sahip olmadığını, aynı zamanda bizden daha iyi performans gösterebileceğini gösterdiği için büyük bir başarıdır, bu da yapay zekanın geleceği ve iş piyasası üzerindeki potansiyel etkisi hakkında soru işaretleri uyandırır.
GPT-4 mevcut büyük dil modellerinin yanı sıra ek eğitim protokolleri veya karşılaştırmaya özel tasarım kullananlar da dahil olmak üzere son teknoloji ürünü (SOTA) modellere göre önemli ölçüde daha iyi performans göstermektedir.
The GPT-4 göre daha yüksek puanlar elde etmiştir. GPT-3Çeşitli kıyaslamalarda 5. Bu, makineler için büyük bir atılımdır çünkü makinelerin artık yalnızca orijinal olarak tasarlanmış sorunları çözmekle kalmayıp, aynı zamanda bunu üniversite öğrencilerinden daha iyi çözebildiklerini de kanıtlamaktadır.
Bu sonuca bakarken dikkate alınması gereken birkaç şey var. İlk olarak, GPT-4 Bu sınavlara yönelik özel bir eğitim verilmedi. Kamuya açık en yeni testleri (Olimpiyatlar ve AP ücretsiz yanıtlı sorular durumunda) kullanarak veya deneme sınavlarının 2022-2023 sürümlerini satın alarak ilerledi. İkinci olarak şunu belirtmekte fayda var. GPT-4Farklı prensipler ve algoritmalar üzerinde çalıştığı için performansı, sınava giren insanların yeteneklerini yansıtmayabilir.
olarak bu büyük bir başarıdır gösteriyor makinelerin yalnızca insan benzeri zekaya sahip olmadığını, aynı zamanda bizden daha iyi performans gösterebileceğini de. Bu, makinelerin giderek daha karmaşık görevleri üstlenebileceği ve sonuçta bize günlük hayatımızda yardımcı olabilecekleri bir geleceğin yolunu açıyor.
Daha fazla oku: 5'ün En Çok Beklenen 2023+ Metinden Görüntüye Yapay Zeka modeli |
GPT-4örneğin, sınava girenlerin ilk %10'u arasında yer alan bir puanla simüle edilmiş bir baro sınavını geçer; GPT-35'in puanı en alttaki %10'daydı. Bu önemli iyileşme GPT-4Performansı, daha büyük eğitim verilerinden ve geliştirilmiş mimarisinden kaynaklanmaktadır. Doğal dil işleme ve otomatik yazma da dahil olmak üzere çeşitli alanlarda geniş bir uygulama yelpazesine sahip olması bekleniyor.
Mevcut büyük modellerin yanı sıra ek eğitim protokolleri veya karşılaştırmalı değerlendirmeye özel tasarım kullanabilenler de dahil olmak üzere son teknoloji (SOTA) modellerin çoğu dil modelleri, önemli ölçüde daha iyi performans gösteriyor GPT-4.
Dahili olarak geliştiriciler şunu kullanıyor: GPT-4programlama, satış, destek ve içerik denetimi gibi faaliyetler üzerinde önemli bir etkisi oldu. Hizalama yöntemimizin ikinci aşaması şu anda devam ediyor; geliştiriciler bunu insanlara yapay zeka sonuçlarını gözden geçirmede yardımcı olmak için kullanıyor.
MMLU (Massive Multi-Task Language Learning) veri seti, farklı görevlerde (matematik, biyoloji, hukuk, sosyal ve beşeri bilimler, vb. dahil olmak üzere 57 alanı kapsayan) dilin anlaşılmasına ilişkin çok çeşitli konulardan sorular içerir. Sorunun biri doğru olmak üzere dört olası yanıtı vardır. Yani rastgele tahmin, %25 doğru cevap sonucunu gösterir. Soru örnekleri ve zorlukları için aşağıdaki resme bakın. Ortalama bir kişi-belirteç (yani, bu bir bilim adamı değil, bir profesör değil - işaretleme olarak ek iş yapan sıradan bir kişi) soruların% 35'ini doğru yanıtlıyor; ancak uzmanlar +/- %90'lık bir puana ulaşabilirler.
Daha fazla oku: Google Üzerinden Yapay Zeka Destekli Bing Kullanmak İçin 5 Neden |
Başlangıçta veri kümesinin tamamı İngilizceydi. Peki ya sorular ve cevaplar diğer dillere, özellikle de daha az yaygın olanlara çevrilirse? Model bir şekilde onların işine yarayacak mı? Bu testte çeviri için Microsoft Azure Translate hizmeti kullanıldı. Çeviriler mükemmel değildir; bazı durumlarda önemli bilgiler kaybolur. Ancak bu durumda dahi GPT-4 diğer dillerde iyi performans gösterir. MMLU'nun çevrilmiş versiyonlarında, GPT-4 İncelenen 24 dilin 26'ünde diğer büyük modellerin (Google'ınki dahil) İngilizce seviyesinden daha iyi performans göstermektedir.
Daha ne, GPT-4 nadir dillerde olduğundan daha iyi performans gösterir ChatGPT İngilizce yaptım (ChatGPT %70.1 puan alırken, yeni modelin Tayland için puanı %71.8 oldu. İngilizce sınavında en yüksek puan elde edildi GPT-4 Google'ın en büyük PaLM'si de dahil olmak üzere diğer modellerden %10 daha iyi performans gösteriyor. Uzmanlardan oluşan bir grup ise %86.4'lık bir skor elde ederken %90'lük bir puan elde etti.
- 2023 yazına kadar yapay zeka yeni bir güç düzeyine ulaşmış olabilir. ChatGPTkullanan bir sohbet robotu GPT-4 algoritma ve Mağazasından GPT-3 570 katına kadar. Çeşitli unsurlar katkıda bulunur ChatGPTdaha "insana benzer" tasarımı ve etkinliğini ve doğruluğunu artırmak için en son veri madenciliği ve doğal dil işlemeyi kullanması da dahil olmak üzere başarısı.
- Microsoft ve OpenAI Ocak ayında işbirliklerini yenilediklerini ve Bing aramanın yapay zekayla geliştirilmiş arama yeteneklerini benimseme planlarını duyurdu. Çok sofistike GPT3.5 modelinin değiştirilmesi, GPT4, yeni başlatıldıve Bing aramanın doğal dil sorgularını anlama ve daha doğru sonuçlar verme kapasitesini büyük ölçüde geliştirme potansiyeline sahiptir. Bir şeylerin ters gitmesi durumunda iyi bir yedekleme planına sahip olmak iyi bir fikirdir.
Daha fazla ilgili haber okuyun:
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.
Daha fazla haberDamir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.