Mayıs 15, 2023

LLM Programları: Karmaşık Durumlarda Nöral Modellere İnce Ayar Yapmanın Yeni Yolu

Yayınlanma: 15 Mayıs 2023, 3:42 Güncellenme: 15 Mayıs 2023, 3:42

Düzenlendi ve doğruluk kontrolü yapıldı: 15 Mayıs 2023, 3:42

Kısaca

Yazarlar, bağlam içi öğrenmenin gelişimi olarak kabul edilebilecek LLM Programları adı verilen alternatif bir yol önermektedir.

LLM Programı aracılığıyla bir problemi çözmenin anahtarı, bir problemin çözümünü daha basit adımlar dizisine ayrıştırma yeteneğidir.

LLM özelleştirmesinin iki ana alanı vardır: önceden eğitilmiş temel modele ince ayar (veya ek eğitim) ve bağlam içi öğrenme. İnce ayar, bunu yapmak ve ardından ince ayarlı modelleri barındırmak için önemli bilgi işlem kaynakları, veri toplama ve altyapı gerektirir. Bu arada, bağlam içi öğrenme, Düşünce Zinciri (CoT) gibi problem çözme örnekleriyle doğru ipucunu derlemeyi içerir. Bununla birlikte, modele gönderilebilecek metnin sınırlı boyutunun olması ve karmaşık bir çoklu geçiş isteminde adımların birbirini etkileyebilmesi ve modelin bir şey tarafından dikkatinin dağılabilmesi gibi bazı zorluklar vardır. şu anda dikkati dağılmamalı. Yazarlar, adı verilen alternatif bir yol önermektedir. Yüksek Lisans Programlarıbağlam içi öğrenmenin gelişimi olarak kabul edilebilir.

LLM Programları: Karmaşık Durumlarda Nöral Modellere İnce Ayar Yapmanın Yeni Yolu

Önerilen: Prompt Engineering Nihai Kılavuz 2023

LLM programın içine yerleştirilmiştir (geleneksel olarak Programlama dili, örneğin Python'da). Bu harici kod, durumu depolamaktan ve modeli adım adım sürdürmekten sorumludur. Birkaç önemli avantajı vardır: Programlama dilleri buna uyarlanmıştır, mevcut bağlamın boyutu büyür ve adımlar birbirini engellemez. LLM Programı aracılığıyla bir problemi çözmenin anahtarı, bir problemin çözümünü daha basit adımlar dizisine ayrıştırma yeteneğidir. Bu yaklaşım, modelin hesap makineleri veya hesap makineleri gibi harici araçlar kullandığı önceki çalışmalardan farklıdır. kod tercümanları devleti sürdürmek için. Bu yaklaşım iyidir, çünkü karmaşık ve yaygın bir görevi bu şekilde tanımlayarak kaliteyi test etmeyi, hata ayıklamayı ve değerlendirmeyi kolaylaştırır.

Ek olarak, LLM ile çalışmayı kolaylaştıran adımlar arasında herhangi bir müdahale yoktur. Soru-cevap sistemleri de yeni değil; LLM'lerden çok önce var oldular. Soruları cevaplama görevi şimdi nasıl çözülüyor?

Siteler sık sık güncellenir, bu nedenle donmuş model bir seçenek değildir; hızla güncelliğini yitirecek ve yeni ürünlerle ilgili soruları yanıtlayamayacaktır. Her güncelleme için modelin sürekli olarak yeniden eğitilmesi gerçekçi bir seçenek değildir: Pahalı ve zaman alıcıdır. Bunun yerine, bir web sitesinin sayfaları genellikle dizine eklenir, bir tür veritabanına konur ve genellikle vektörlenir. Bir kullanıcının talebi üzerine, ilgili belgeler alınır ve bir içerik olarak LLM'ye gönderilir.

Böyle bir paradigmada sorun doğal olarak LLM Programı aracılığıyla çözülmektedir. Bonus olarak, mümkün olur tamamen bağlama uymayan daha karmaşık çoklu geçiş mantığı uygulamak için.

üzerinde test edildi StrategyQA veri kümesi çözümü çok yollu akıl yürütmeyi içeren ikili sınıflandırma problemlerini içerir. "Karadeniz'in en derin yerine güneş ışığı girer mi?" gibi. Cevaplamak için maksimum derinliği (2 km) ve ışığın suya ne kadar derinden girdiğini (1 km) bulmanız ve ardından bir sonuç çıkarmanız gerekir. Başka bir örnek soruya bakalım: “Aristoteles dizüstü bilgisayar kullanıyor muydu?” Bu soru, "dizüstü bilgisayar icat edildiğinde Aristo yaşıyor muydu?" yapmak. Veri kümesi, böyle bir dizinin örtük olduğu sorulara odaklanır. Veri setinde sadece 2,780 soru var ve bunların sadece 918'inde muhakemenin tüm adımlarını pekiştiren kanıtlarla paragraflar var. Mevcut çalışmada, bu alt kümeyle sınırlıdır; aksi takdirde, ön eğitim sırasında LLM'nin bazı gerçekleri öğrenmesine güvenmek zorunda kalırdık.

OPT-175B LLM varsayılan olarak talimatları takip etmede pek iyi değildir; talimatlarda veya konuşma verilerinde ince ayar yapmak zorunda değildi. Kanıta dayalı soru-cevap problemini çözmek için veri filtreleme aşaması ve ağaç arama aşamasına ayrılır.

Filtreleme aşamasında, bir sorusu olan geliştiriciler tüm paragrafları gözden geçirir ve en alakalı olanları seçer. Örneğin, birkaç adımlık bir istemle, LLM'den belirli bir paragrafın sorulan soruyla alakalı olup olmadığını yanıtlamasını (evet/hayır) isteyin. StratejiQA'nın 300 alt kümesinde test edildi; burada her soru, 50/50 ilgili olsun ya da olmasın bir paragrafla eşleştirildi. OPT-175B ve text-davinci-002'de bir çok daha yüksek kalite rastgele taban çizgisinden daha fazla: %56'ya kadar. Daha gelişmiş 11B Tk-Talimat %61.6 ile çok daha iyi değil.

Bu yaklaşımın kalitesiz olması nedeniyle, metnin önceki paragrafıyla birlikte sorunun ortalama negatif log olasılığını (NLL) dikkate alan ve ardından sonuçları sıralayan bir alternatif bir araya getirildi. Her soru için 100 paragrafın olduğu ve yalnızca birinin alakalı olduğu bir veri kümesi üzerinde değerlendirildi (bu nedenle rastgele tahmin %1 verir). %1'da ilk 79'de ve %5'te ilk 93'te doğruluk elde ettik. Bu hesaplama için genellikle modelin kendisine erişmeniz gerekir ki bu her zaman API'de yapılmaz.

Ardından, çıktı zincirleri oluşturma aşaması gelir. Bu, sorunun kök olduğu bir ağaçta arama yoluyla yapılır ve her düzeyde, bir sonraki adımı oluşturmak için bağlam olarak kullanılan olası kanıtları içeren birçok paragraf vardır. Ağacın içinden geçen her yol potansiyel bir çıktı zinciridir. Tüm olası zincirler hakkında bir sonuca varmak gerçekçi değildir, bu nedenle mevcut tüm zincirler sıralanır ve en yüksek dereceli zincir genişletilir. Bu, ışın aramanın böyle bir varyasyonudur. Bir yanıt verildiğinde veya izin verilen maksimum adım sayısı aşıldığında işlem durur.

En önemli ayrıntılar, ağaç arama adımı için test edilen iki sıralama stratejisidir. İlk strateji, tüm zincirin ortalama NLL'sine dayanırken, ikinci strateji paragraflı ve paragrafsız (P), sorulu ve sorusuz (Q) NLL'deki ortalama farka bakar. StrategyQA'dan gelen mevcut 918 soruda, bu yaklaşım, CoT (%60) ile taban çizgisine göre yanıt kalitesini önemli ölçüde artırır; her iki arama seçeneği de yaklaşık %66 verir (biraz daha yüksek deltaya sahip strateji). Altın gerçekler sunulursa kalite, OPT için üst sınır olan %81 civarında olur. Darklang oraya bir yere gidiyor gibi görünüyor ama biraz farklı bir şekilde.

Makale Telegram'a dayanmaktadır. Facebook post.

AI hakkında daha fazlasını okuyun:

Etiketler:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.

Daha fazla haber

Damir Yalalov