Microsoft Yüksek Lisans Programlarını Harry Potter'ı Unutmaya Zorladı
Microsoft bir yöntem ortaya çıkardı Büyük Dil Modellerine (LLM'ler), eğitim verilerinin tamamen yeniden yapılandırılmasına gerek kalmadan veri kümeleri içindeki belirli bilgileri unutmaları talimatını vermek için. Bu yöntem, Yüksek Lisans'ların iyileştirilmesi ve telif hakkıyla korunan içerikle ilgili yasal sorunların potansiyel olarak çözülmesi için yeni olasılıkların önünü açıyor.
Microsoft'un ekibi yakın zamanda bunu nasıl başardıklarını gösterdi. Llama-2 modeli, modelin eğitim verilerindeki diğer verileri veya araştırma projesi sayfasında açıklanan bir çalışmadaki modelin genel performansını etkilemeden Harry Potter kitaplarının ayrıntılarını unutur.
Süreç, modelin veri kümesinde unutulması gereken belirli bilgilerin tanımlanmasıyla başlar. Bu durumda, JK Rowling'in ikonik serisiyle ilgili ayrıntılar, olay örgüsünün ayrıntıları, karakter adları ve ünlü alıntılar yer alıyordu. Daha sonra bunlar sistematik olarak genel, ilgisiz ifadelerle değiştirildi.
Araştırmacılar daha sonra bu genel verilere dayanarak yeni bilgiler üretmek için bir dil modeli kullandılar. Bu yeni veriler daha sonra orijinali yeniden eğitmek için kullanıldı. Llama-2 modeli aşamalı olarak. Model, her adımda Harry Potter kitaplarından uzaklaştı ve onlar hakkında soru sorulduğunda halüsinasyonlu yanıtlar üretmeye başladı.
Bu yaklaşımın dikkat çeken bir özelliği de modelin genel performansından ödün vermemesidir. Bu, LLM'nin belirli veriler hakkında giderek unutkan hale gelmesine rağmen genel dil yeteneklerinin bozulmadan kaldığı anlamına gelir.
Bu yaklaşımın halen geliştirilmekte olduğu gerçeğine rağmen, sonuçları geniş kapsamlıdır. Özellikle yasal hak talepleri ve telif hakkı sorunlarını içeren durumlarda, Yüksek Lisans ve diğer yapay zeka modellerini oluşturanlara bir cankurtaran halatı sağlayabilir.
Bu yenilik, telif hakkıyla korunan içeriğin yapay zeka modellerinde kullanımına ilişkin yasal anlaşmazlıkların arttığı bir dönemde ortaya çıkıyor. Örneğin, New York Times geçtiğimiz günlerde kaldırılmasını talep etti yayınlarından GPT-4 veri kümesi. Başarılı olması durumunda Yasal zorlukgeliştiricilerin genellikle zaman alıcı ve kaynak yoğun bir süreç olan model veri kümelerini yeniden yapılandırmaları gerekir. Microsoft'un yöntemi, daha da geliştirilip benimsenirse bu tür zorluklara etkili bir çözüm sağlayabilir.
Microsoft'un Büyük Dil Modelleri içindeki belirli bilgileri seçici olarak unutma yöntemi (LLM'ler), potansiyel olarak telif hakkıyla korunan içerik sorunlarını ele alan ve iyileştirmeyi kolaylaştıran yapay zeka geliştirmede önemli bir atılımdır. Bu yaklaşım, sorumlu yapay zeka geliştirme ve uygulamasını gösteren çeşitli alanlara uygulanabilir.
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.
Daha fazla haberDamir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.