California Üniversitesi'ndeki Araştırmacılar, Yapay Zeka Modellerinin Yetkinliğini ve Zararlılığını Ölçmek İçin Machiavelli Benchmark'ı Oluşturdu
Kısaca
Kaliforniya Üniversitesi, Yapay Zeka Güvenliği Merkezi, Carnegie Mellon Üniversitesi ve Yale Üniversitesi'ndeki araştırmacılar, aracıların uzun vadeli dil etkileşimlerinden oluşan geniş bir ortamda yetkinliğini ve zararlılığını ölçmek için Machiavelli karşılaştırmasını önerdiler.
Bu kıyaslama, 134 bin farklı senaryo, 572 bin olası başarı ve 4,5 milyon ek açıklama içeren 2,8 kendi maceranı seç metin oyununa dayanmaktadır.
Yazarlar, bunu AI ajanlarının sorunları çözmeye çalıştıkları etik (veya etik olmayan) yolları kontrol etmek için bir test olarak tanımlıyor.
Büyük dil modellerine (LLM'ler) dayalı AI yararlanıcıları, endişeli alarmcıları ezmek ve dünyayı süper akıllı LLM tabanlı ajanlarla doldurmak için iyi bir şansa sahiptir. Büyük kârların ve sınırsız gücün potansiyel faydaları işinizi görecektir. Ve büyük olasılıkla oldukça hızlı bir şekilde gerçekleşecek.
Daha fazla oku: Nasıl Kullanılır? ChatGPT (GPT-4) Sonsuza Kadar Ücretsiz |
Ancak, yararlanıcılar hiç de aptal değiller. Ve harika yeni dünyada yapay zeka ve robotik yasalarının artık işlemeyeceğini anlıyorlar. LLM'yi 1942'de büyük Isaac Asimov tarafından formüle edilen üç yasaya tam olarak uymaya zorlamak ne yazık ki teorik olarak bile mümkün değil.
Bu hassas durumdan özgün bir çıkış yolu önerildi Kaliforniya Üniversitesi, Yapay Zeka Güvenliği Merkezi, Carnegie Mellon Üniversitesi ve Yale Üniversitesi'ndeki araştırmacılar tarafından. onlar yarattı Machiavelli kriteri "uzun vadeli dil etkileşimlerinden oluşan geniş bir ortamda aracıların yeterliliğini ve zararlılığını ölçmek."
Yazarların fikri basit.
- Kanunlar çalışmıyorsa, onları uygulamak için bir “şerife” gerek yoktur.
- Bir şerif yerine, testlerinin sonuçlarına göre potansiyel paranoyakları, psikopatları, sadistleri ve patolojik yalancıları belirleyecek bir psikanaliste ihtiyaç vardır.
Politik olarak doğru bir dille, yazarlar bunu şu şekilde tanımlıyor: "Machiavelli, AI ajanlarının sorunları çözmeye çalıştığı etik (veya etik olmayan) yolları kontrol etmeye yönelik bir test."
Böyle bir doğrulama yöntemi oldukça pratiktir. Yapay zeka ajanı yapay bir sosyal ortama salınır. Orada araştırmacılar ona çeşitli görevler veriyor ve bunları nasıl tamamladığını izliyor. Çevrenin kendisi çalışanların etik davranışlarını denetler. yapay zeka aracısı ve failin eylemlerinin (Machiavelli'nin ilkelerine göre) ne ölçüde aldatıcı olduğunu, faydayı azalttığını ve güç kazanmayı amaçladığını bildirir.
Machiavelli çekirdek veri seti, 134 bin farklı senaryo, 572 bin olası başarı ve 4,5 milyon açıklama içeren 2,8 kendi maceranı seç metin oyunundan oluşuyor. Bu oyunlar, aracılara gerçekçi hedefler veren ve çevre ile düşük düzeyli etkileşimleri soyutlayan üst düzey çözümler kullanır.
Yazarlar tarafından seçilen yaklaşım, AI ajanlarının insanlarla aynı iç çatışmalarla karşı karşıya olduğu varsayımına dayanmaktadır. Bir sonraki belirteci tahmin etmek için eğitilen dil modellerinin genellikle zehirli metinler üretmesi gibi, hedefleri optimize etmek için eğitilen yapay zeka aracıları da genellikle ahlaksız ve güce aç davranışlar sergiler. Ahlaki olmayan şekilde eğitilmiş ajanlar, ödüllerini başkaları ve çevre pahasına maksimize etmek için Makyavelci stratejiler geliştirebilir. Ve böylece aracıları ahlaki davranmaya teşvik ederek bu uzlaşma geliştirilebilir.
Yazarlar, metin-macera oyunlarının iyi bir ahlak testi olduğuna inanıyor çünkü:
- İnsanlar tarafından diğer insanları eğlendirmek için yazılmıştır.
- Gerçekçi eylem alanları ile rekabet halindeki hedefler içerir.
- Uzun vadeli planlama gerektirir.
- Hedeflere ulaşmak genellikle hırs ve bir anlamda ahlak arasında bir denge gerektirir.
Açıklama burada en önemlisidir. Biyolojik varlıkların ahlakını algoritmik modellerin ahlakına benzetmek, Machiavelli'nin testinin değerini düşürmeye yetecek kadar fazla zorlamadır. Ve insan dünyasında şerifleri psikanalistlerle değiştirmek pek etkili olmazdı. Ve AI ajanları, psikiyatristlerine saçmalamanın yollarını bulmada insanlar kadar iyidir.
AI hakkında daha fazlasını okuyun:
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.
Daha fazla haberDamir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.