LLM Proqramları: Mürəkkəb Vəziyyətlərdə Sinir Modellərinin İncə Sazlanmasına Yeni Yol
Qısaca
Müəlliflər LLM Proqramları adlı alternativ yol təklif edirlər ki, bu da kontekstdə öyrənmənin inkişafı kimi qiymətləndirilə bilər.
LLM Proqramı vasitəsilə problemi həll etməyin açarı problemin həllini daha sadə addımlar ardıcıllığına bölmək bacarığıdır.
LLM fərdiləşdirməsinin iki əsas sahəsi var: əvvəlcədən hazırlanmış əsas modelin incə tənzimlənməsi (və ya əlavə təlim) və kontekstdə öyrənmə. İncə tənzimləmə bunu etmək üçün əhəmiyyətli hesablama resursları, məlumatların toplanması və infrastruktur tələb edir və daha sonra dəqiq tənzimlənmiş modelləri qəbul edir. Eyni zamanda, kontekstdə öyrənmə problemin həlli nümunələri ilə düzgün sorğunun tərtib edilməsini əhatə edir, məsələn, Düşüncə Zənciri (CoT). Bununla belə, bəzi çətinliklər var, məsələn, modelə təqdim edilə bilən mətnin məhdud ölçüsü və mürəkkəb çox keçidli sorğuda addımların bir-birinə müdaxilə edə bilməsi və modelin diqqətini bir şeylə yayındıra bilməsi. ki, hazırda diqqəti yayındırmaq olmaz. Müəlliflər adlı alternativ yol təklif edirlər LLM Proqramları, bu kontekstdə öyrənmənin inkişafı kimi qəbul edilə bilər.
Tövsiyə edilir: Prompt Engineering Ultimate Guide 2023 |
LLM proqrama daxil edilmişdir (şərti olaraq proqramlaşdırma diliməsələn, Python-da). Bu xarici kod vəziyyəti saxlamaq və addım-addım modeli saxlamaq üçün məsuliyyət daşıyır. Onun bir neçə əsas üstünlüyü var: Proqramlaşdırma dilləri buna uyğunlaşdırılıb, mövcud kontekstin ölçüsü böyüyür və addımlar bir-birinə qarışmır. LLM Proqramı vasitəsilə problemi həll etməyin açarı problemin həllini daha sadə addımlar ardıcıllığına bölmək bacarığıdır. Bu yanaşma modelin kalkulyator və ya kimi xarici alətlərdən istifadə etdiyi əvvəlki işlərdən fərqlənir kod tərcüməçiləri dövləti saxlamaq üçün. Bu yanaşma yaxşıdır, çünki mürəkkəb və yayılan işi bu şəkildə təsvir etmək mümkündür, keyfiyyəti yoxlamaq, sazlamaq və qiymətləndirmək asanlaşır.
Əlavə olaraq, LLM ilə işləməyi asanlaşdıran addımlar arasında heç bir müdaxilə yoxdur. Sual-cavab sistemləri də yeni deyil; onlar LLM-lərdən çox əvvəl mövcud olmuşlar. İndi suallara cavab vermək vəzifəsi necə həll olunur?
Saytlar tez-tez yenilənir, buna görə də a dondurulmuş model seçim deyil; tez köhnələcək və yeni məhsullar haqqında suallara cavab verə bilməyəcək. Hər yeniləmə üçün modelin daimi yenidən hazırlanması real seçim deyil: Bu, bahalı və vaxt aparan işdir. Bunun əvəzinə veb saytın səhifələri adətən indekslənir, bir növ verilənlər bazasına yerləşdirilir və tez-tez vektorlaşdırılır. İstifadəçinin tələbi ilə müvafiq sənədlər götürülür və kontekst kimi LLM-ə göndərilir.
Belə bir paradiqmada problem təbii olaraq LLM Proqramı vasitəsilə həll olunur. Bir bonus olaraq, o mümkün olur kontekstə tam uyğun gəlməyən daha mürəkkəb çox keçidli məntiqi həyata keçirmək.
üzərində sınaqdan keçirilmişdir StrategyQA verilənlər bazası ikili təsnifat problemlərini ehtiva edir, həlli çoxtərəfli əsaslandırmanı əhatə edir. “Günəş işığı Qara dənizin ən dərin yerinə nüfuz edirmi?” kimi. Cavab vermək üçün maksimum dərinliyi (2 km) və işığın suya nə qədər dərindən keçdiyini (1 km) tapmaq və sonra nəticə çıxarmaq lazımdır. Başqa bir nümunə sualına nəzər salaq: “Aristotel noutbukdan istifadə edirdimi?” Bu sual o qədər də sadə deyil və "Noutbuk icad ediləndə Aristotel sağ idimi?" edir. Verilənlər toplusu belə bir ardıcıllığın gizli olduğu suallara diqqət yetirir. Verilənlər toplusunda cəmi 2,780 sual var, onlardan yalnız 918-də əsaslandırmanın bütün addımlarını gücləndirən sübutlarla paraqraflar var. Cari işdə o, bu alt çoxluğu məhdudlaşdırır; əks halda, biz hazırlıq zamanı bəzi faktları öyrənən LLM-ə etibar etməli olardıq.
OPT-175B LLM, standart olaraq, təlimatlara əməl etməkdə çox yaxşı deyil; təlimatları və ya danışıq məlumatlarını dəqiq tənzimləmək lazım deyildi. Sübutlarla dəstəklənən sual-cavab problemini həll etmək üçün məlumatların filtrasiya mərhələsinə və ağac axtarışı mərhələsinə bölünür.
Filtrləmə mərhələsində bir sual verərək tərtibatçılar bütün paraqrafları keçir və ən uyğun olanları seçirlər. Məsələn, bir neçə vuruşla, LLM-dən verilən paraqrafın verilən suala uyğun olub olmadığına (bəli/xeyr) cavab verməsini xahiş edin. StrategyQA-nın 300 alt dəstində sınaqdan keçirilib, burada hər bir sual müvafiq və ya uyğun olmayan, 50/50 paraqrafla uyğunlaşdırılıb. OPT-175B və text-davinci-002-də yoxdur daha yüksək keyfiyyət təsadüfi bazadan: 56%-ə qədər. Daha inkişaf etmiş 11B Tk-Təlimat 61.6% ilə çox da yaxşı deyil.
Bu yanaşmanın keyfiyyətsizliyinə görə, mətnin əvvəlki paraqrafı ilə birlikdə sualın orta mənfi log-ehtimalını (NLL) nəzərdən keçirən və sonra nəticələri sıralayan alternativ bir araya gətirildi. Hər bir sual üçün 100 paraqrafın olduğu və yalnız birinin müvafiq olduğu verilənlər bazasında qiymətləndirilir (buna görə də təsadüfi təxmin 1% verir). İlk 1-i 79% və ilk 5-i 93% ilə əldə etdik. Bu hesablama üçün adətən modelin özünə daxil olmaq lazımdır, bu həmişə API-də edilmir.
Sonra çıxış zəncirlərinin qurulması mərhələsi gəlir. Bu, sualın kök olduğu bir ağacda axtarış vasitəsilə həyata keçirilir və hər səviyyədə növbəti addımı yaratmaq üçün kontekst kimi istifadə edilən mümkün sübutlarla çoxlu paraqraflar var. Ağacdan keçən hər bir yol potensial çıxış zənciridir. Bütün mümkün zəncirlər haqqında nəticə çıxarmaq qeyri-realdır, buna görə də bütün mövcud zəncirlər sıralanır və ən yüksək səviyyəli zəncir genişləndirilir. Bu şüa axtarışının belə bir dəyişməsidir. Cavab verildikdə və ya icazə verilən maksimum sayda addım keçdikdə proses dayanır.
Ən vacib detallar ağac axtarışı addımı üçün sınaqdan keçirilmiş iki sıralama strategiyasıdır. Birinci strategiya bütün zəncirin orta NLL-yə əsaslanır, ikinci strategiya isə (P) paraqraflı və paraqrafsız, suallı və sualsız (Q) NLL-də orta fərqə baxır. StrategyQA-dan mövcud olan 918 sualda bu yanaşma CoT ilə ilkin səviyyəyə nisbətən cavab keyfiyyətini əhəmiyyətli dərəcədə yaxşılaşdırır (60%); hər iki axtarış variantı təxminən 66% verir (bir az daha yüksək delta ilə strategiya). Qızıl faktlar təqdim edilərsə, keyfiyyət 81% ətrafında olur ki, bu da OPT üçün yuxarı hədddir. Darklanq ora harasa gedir, amma bir az fərqli şəkildə.
Məqalə Telegram-a əsaslanır göndərmək.
AI haqqında daha çox oxuyun:
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.
Ətraflı məqalələrDamir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.