Haber Raporu Teknoloji
16 Mart, 2023

GPT-4 Geçmişten Gelen “Halüsinasyon” Gerçeklerini ve Muhakeme Hatalarını Miras Alır GPT Modeller

Kısaca

OpenAI diyor GPT-4 daha önce olduğu gibi benzer sınırlamalara sahip GPT modelleri.

GPT-4 hâlâ gerçekleri halüsinasyona uğratıyor ve muhakeme hataları yapıyor.

Bununla birlikte, GPT-4 göre %40 daha yüksek puanlar alıyor OpenAIen son GPT-3.5 şirketin dahili çekişmeli gerçekçilik değerlendirmeleri hakkında.

GPT-4 Geçmişten Gelen "Halüsinasyonlu" Gerçekleri ve Muhakeme Hatalarını Miras Alır GPT Modeller

OpenAI kullanıcıları en son dil modeli konusunda uyardı, GPT-4, hala tam olarak güvenilir değildir ve gerçekleri "halüsinasyona uğratabilir" ve muhakeme hataları yapabilir. Şirket, kullanıcıları özellikle "yüksek riskli bağlamlarda" dil modeli çıktılarını kullanırken dikkatli olmaya çağırıyor.

Ancak, iyi haber şu ki GPT-4 önceki modellere göre halüsinasyonları önemli ölçüde azaltır. OpenAI iddia ediyor GPT-4 en sonuncusundan %40 daha yüksek puan aldı GPT-3.5 dahili çekişmeli gerçekçilik değerlendirmeleri hakkında. 

üzerinden OpenAI

"Modelin gerçekleri rakip olarak seçilmiş bir dizi yanlış ifadeden ayırma yeteneğini test eden TruthfulQA gibi harici kıyaslamalarda ilerleme kaydettik. Bu sorular, istatistiksel olarak çekici olan olgulara dayalı olarak yanlış yanıtlarla eşleştirildi." OpenAI bir yazdı blog yazısı.

Bu iyileştirmeye rağmen model, Eylül 2021'den sonra meydana gelen olaylar hakkında hâlâ bilgi sahibi değil ve tıpkı önceki modellerde olduğu gibi bazen basit mantık hataları yapıyor. Ek olarak, kullanıcılardan gelen bariz yanlış ifadeleri kabul etmekte aşırı derecede saf olabilir ve koduna güvenlik açıkları eklemek gibi zor sorunlarda başarısız olabilir. Ayrıca sağladığı bilgilerin doğruluğunu kontrol etmez.

Selefleri gibi, GPT-4 zararlı tavsiyeler, hatalı kodlar veya yanlış bilgiler üretebilir. Ancak modelin ek yetenekleri anlaşılması gereken yeni risk yüzeylerine yol açmaktadır. Bu risklerin boyutunu değerlendirmek için, 50'den fazla uzman Modeli rakipli olarak test etmek için yapay zeka hizalama riskleri, siber güvenlik, biyorisk, güven ve güvenlik ve uluslararası güvenlik dahil olmak üzere çeşitli alanlardan kişiler devreye alındı. Daha sonra onların geri bildirimleri ve verileri, modeli geliştirmek için ek veriler toplamak gibi yöntemlerle kullanıldı. GPT-4Tehlikeli kimyasalların nasıl sentezleneceğine dair talepleri reddetme yeteneği.

Ana yollardan biri OpenAI Zararlı çıktıları azaltmak, RLHF (İnsan Geri Bildiriminden Güçlendirme Öğrenimi) eğitimi sırasında ek bir güvenlik ödül sinyali dahil etmektir. Sinyal, modeli aşağıdaki gibi zararlı içerik isteklerini reddetmesi için eğitir: defimodelin kullanım kurallarına göre belirlenir. Ödül bir kişi tarafından sağlanmaktadır. GPT-4 Güvenlikle ilgili istemlere göre güvenlik sınırlarını ve tamamlama stilini değerlendiren sıfır atış sınıflandırıcısı.

OpenAI ayrıca modelin izin verilmeyen içerik taleplerine yanıt verme eğilimini önceki modele kıyasla %82 oranında azalttığını söyledi. GPT-3.5 ve GPT-4 Şirketin politikalarına uygun olarak tıbbi tavsiye ve kendine zarar verme gibi hassas taleplere %29 daha sık yanıt veriyor.

üzerinden OpenAI

Süre OpenAImüdahaleleri kötü davranışları ortaya çıkarmanın zorluğunu artırdı GPT-4, bu hala mümkün ve kullanım kurallarını ihlal eden içerik oluşturabilen jailbreak'ler hala mevcut. 

"Yapay zeka sistemleri daha yaygın hale geldikçe, bu müdahalelerde yüksek derecede güvenilirlik elde etmek giderek daha kritik hale gelecektir. Şimdilik, bu sınırlamaları kötüye kullanım için izleme gibi konuşlandırma zamanı güvenlik teknikleriyle tamamlamak çok önemli" diye ekledi.

OpenAI potansiyel etkilerini daha iyi anlamak ve değerlendirmek için dış araştırmacılarla işbirliği yapıyor. GPT-4 ve onun ardıl modelleri. Ekip ayrıca gelecekteki yapay zeka sistemlerinde ortaya çıkabilecek tehlikeli yeteneklere yönelik değerlendirmeler de geliştiriyor. Potansiyel sosyal ve ekonomik etkiler of GPT-4 ve diğer yapay zeka sistemleri, OpenAI tespitlerini ve içgörülerini zamanı geldiğinde kamuoyu ile paylaşacaktır.

Daha fazla oku:

Etiketler:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Cindy bir gazetecidir. Metaverse Postile ilgili konuları kapsayan web3, NFT, metaverse ve AI ile yapılan görüşmelere odaklanarak Web3 endüstri oyuncuları. 30'dan fazla C düzeyindeki yöneticiyle konuştu ve onların değerli görüşlerini okuyuculara aktardı. Aslen Singapurlu olan Cindy şu anda Gürcistan'ın Tiflis şehrinde yaşıyor. Güney Avustralya Üniversitesi'nden İletişim ve Medya Çalışmaları alanında lisans derecesine sahiptir ve gazetecilik ve yazarlık alanında on yıllık deneyime sahiptir. Onunla iletişime geçin [e-posta korumalı] basın açıklamaları, duyurular ve röportaj imkanları ile.

Daha fazla haber
Cindy Tan
Cindy Tan

Cindy bir gazetecidir. Metaverse Postile ilgili konuları kapsayan web3, NFT, metaverse ve AI ile yapılan görüşmelere odaklanarak Web3 endüstri oyuncuları. 30'dan fazla C düzeyindeki yöneticiyle konuştu ve onların değerli görüşlerini okuyuculara aktardı. Aslen Singapurlu olan Cindy şu anda Gürcistan'ın Tiflis şehrinde yaşıyor. Güney Avustralya Üniversitesi'nden İletişim ve Medya Çalışmaları alanında lisans derecesine sahiptir ve gazetecilik ve yazarlık alanında on yıllık deneyime sahiptir. Onunla iletişime geçin [e-posta korumalı] basın açıklamaları, duyurular ve röportaj imkanları ile.

DOGE Çılgınlığı: Dogecoin'in (DOGE) Son Zamanlardaki Değer Artışını Analiz Etmek

Kripto para endüstrisi hızla genişliyor ve meme paraları önemli bir yükselişe hazırlanıyor. Dogecoin (DOGE),...

bilmek Daha

Metaevrende Yapay Zeka Tarafından Üretilen İçeriğin Evrimi

Üretken AI içeriğinin ortaya çıkışı, sanal ortamdaki en büyüleyici gelişmelerden biridir ...

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
Bu Haftanın En İyi Fırsatları, Yapay Zeka, BT Alanında Büyük Yatırımlar, Web3ve Kripto (22-26.04)
özet İşletme Piyasalar Teknoloji
Bu Haftanın En İyi Fırsatları, Yapay Zeka, BT Alanında Büyük Yatırımlar, Web3ve Kripto (22-26.04)
26 Nisan 2024
Vitalik Buterin PoW'un Merkezileştirilmesi Hakkında Yorum Yaptı ve PoS'a Kadar Bunun Geçici Bir Aşama Olduğunu Not Etti
Haber Raporu Teknoloji
Vitalik Buterin PoW'un Merkezileştirilmesi Hakkında Yorum Yaptı ve PoS'a Kadar Bunun Geçici Bir Aşama Olduğunu Not Etti
26 Nisan 2024
Offchain Labs, Optimism'in OP Stack'in Dolandırıcılık Kanıtlarında İki Kritik Güvenlik Açığı Keşfediyor
Haber Raporu Software Teknoloji
Offchain Labs, Optimism'in OP Stack'in Dolandırıcılık Kanıtlarında İki Kritik Güvenlik Açığı Keşfediyor
26 Nisan 2024
Dymension'ın RollApps'ten Likiditeyi Köprülemeye Yönelik Açık Pazarı eIBC Mainnet'te Başlatılıyor
Haber Raporu Teknoloji
Dymension'ın RollApps'ten Likiditeyi Köprülemeye Yönelik Açık Pazarı eIBC Mainnet'te Başlatılıyor 
26 Nisan 2024
CRYPTOMERIA LABS PTE. LTD.