GPT-4 Geçmişten Gelen “Halüsinasyon” Gerçeklerini ve Muhakeme Hatalarını Miras Alır GPT Modeller
Kısaca
OpenAI diyor GPT-4 daha önce olduğu gibi benzer sınırlamalara sahip GPT modelleri.
GPT-4 hâlâ gerçekleri halüsinasyona uğratıyor ve muhakeme hataları yapıyor.
Bununla birlikte, GPT-4 göre %40 daha yüksek puanlar alıyor OpenAIen son GPT-3.5 şirketin dahili çekişmeli gerçekçilik değerlendirmeleri hakkında.
OpenAI kullanıcıları en son dil modeli konusunda uyardı, GPT-4, hala tam olarak güvenilir değildir ve gerçekleri "halüsinasyona uğratabilir" ve muhakeme hataları yapabilir. Şirket, kullanıcıları özellikle "yüksek riskli bağlamlarda" dil modeli çıktılarını kullanırken dikkatli olmaya çağırıyor.
Ancak, iyi haber şu ki GPT-4 önceki modellere göre halüsinasyonları önemli ölçüde azaltır. OpenAI iddia ediyor GPT-4 en sonuncusundan %40 daha yüksek puan aldı GPT-3.5 dahili çekişmeli gerçekçilik değerlendirmeleri hakkında.
"Modelin gerçekleri rakip olarak seçilmiş bir dizi yanlış ifadeden ayırma yeteneğini test eden TruthfulQA gibi harici kıyaslamalarda ilerleme kaydettik. Bu sorular, istatistiksel olarak çekici olan olgulara dayalı olarak yanlış yanıtlarla eşleştirildi." OpenAI bir yazdı blog yazısı.
Bu iyileştirmeye rağmen model, Eylül 2021'den sonra meydana gelen olaylar hakkında hâlâ bilgi sahibi değil ve tıpkı önceki modellerde olduğu gibi bazen basit mantık hataları yapıyor. Ek olarak, kullanıcılardan gelen bariz yanlış ifadeleri kabul etmekte aşırı derecede saf olabilir ve koduna güvenlik açıkları eklemek gibi zor sorunlarda başarısız olabilir. Ayrıca sağladığı bilgilerin doğruluğunu kontrol etmez.
Selefleri gibi, GPT-4 zararlı tavsiyeler, hatalı kodlar veya yanlış bilgiler üretebilir. Ancak modelin ek yetenekleri anlaşılması gereken yeni risk yüzeylerine yol açmaktadır. Bu risklerin boyutunu değerlendirmek için, 50'den fazla uzman Modeli rakipli olarak test etmek için yapay zeka hizalama riskleri, siber güvenlik, biyorisk, güven ve güvenlik ve uluslararası güvenlik dahil olmak üzere çeşitli alanlardan kişiler devreye alındı. Daha sonra onların geri bildirimleri ve verileri, modeli geliştirmek için ek veriler toplamak gibi yöntemlerle kullanıldı. GPT-4Tehlikeli kimyasalların nasıl sentezleneceğine dair talepleri reddetme yeteneği.
Ana yollardan biri OpenAI Zararlı çıktıları azaltmak, RLHF (İnsan Geri Bildiriminden Güçlendirme Öğrenimi) eğitimi sırasında ek bir güvenlik ödül sinyali dahil etmektir. Sinyal, modeli aşağıdaki gibi zararlı içerik isteklerini reddetmesi için eğitir: defimodelin kullanım kurallarına göre belirlenir. Ödül bir kişi tarafından sağlanmaktadır. GPT-4 Güvenlikle ilgili istemlere göre güvenlik sınırlarını ve tamamlama stilini değerlendiren sıfır atış sınıflandırıcısı.
OpenAI ayrıca modelin izin verilmeyen içerik taleplerine yanıt verme eğilimini önceki modele kıyasla %82 oranında azalttığını söyledi. GPT-3.5 ve GPT-4 Şirketin politikalarına uygun olarak tıbbi tavsiye ve kendine zarar verme gibi hassas taleplere %29 daha sık yanıt veriyor.
Süre OpenAImüdahaleleri kötü davranışları ortaya çıkarmanın zorluğunu artırdı GPT-4, bu hala mümkün ve kullanım kurallarını ihlal eden içerik oluşturabilen jailbreak'ler hala mevcut.
"Yapay zeka sistemleri daha yaygın hale geldikçe, bu müdahalelerde yüksek derecede güvenilirlik elde etmek giderek daha kritik hale gelecektir. Şimdilik, bu sınırlamaları kötüye kullanım için izleme gibi konuşlandırma zamanı güvenlik teknikleriyle tamamlamak çok önemli" diye ekledi.
OpenAI potansiyel etkilerini daha iyi anlamak ve değerlendirmek için dış araştırmacılarla işbirliği yapıyor. GPT-4 ve onun ardıl modelleri. Ekip ayrıca gelecekteki yapay zeka sistemlerinde ortaya çıkabilecek tehlikeli yeteneklere yönelik değerlendirmeler de geliştiriyor. Potansiyel sosyal ve ekonomik etkiler of GPT-4 ve diğer yapay zeka sistemleri, OpenAI tespitlerini ve içgörülerini zamanı geldiğinde kamuoyu ile paylaşacaktır.
Daha fazla oku:
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Cindy bir gazetecidir. Metaverse Postile ilgili konuları kapsayan web3, NFT, metaverse ve AI ile yapılan görüşmelere odaklanarak Web3 endüstri oyuncuları. 30'dan fazla C düzeyindeki yöneticiyle konuştu ve onların değerli görüşlerini okuyuculara aktardı. Aslen Singapurlu olan Cindy şu anda Gürcistan'ın Tiflis şehrinde yaşıyor. Güney Avustralya Üniversitesi'nden İletişim ve Medya Çalışmaları alanında lisans derecesine sahiptir ve gazetecilik ve yazarlık alanında on yıllık deneyime sahiptir. Onunla iletişime geçin [e-posta korumalı] basın açıklamaları, duyurular ve röportaj imkanları ile.
Daha fazla haberCindy bir gazetecidir. Metaverse Postile ilgili konuları kapsayan web3, NFT, metaverse ve AI ile yapılan görüşmelere odaklanarak Web3 endüstri oyuncuları. 30'dan fazla C düzeyindeki yöneticiyle konuştu ve onların değerli görüşlerini okuyuculara aktardı. Aslen Singapurlu olan Cindy şu anda Gürcistan'ın Tiflis şehrinde yaşıyor. Güney Avustralya Üniversitesi'nden İletişim ve Medya Çalışmaları alanında lisans derecesine sahiptir ve gazetecilik ve yazarlık alanında on yıllık deneyime sahiptir. Onunla iletişime geçin [e-posta korumalı] basın açıklamaları, duyurular ve röportaj imkanları ile.