, 15 2023 mumkin

LLM dasturlari: murakkab vaziyatlarda neyron modellarni nozik sozlashning yangi yo'li

Nashr qilingan: 15 yil 2023-may, 3:42 Yangilangan: 15-yil, 2023-may, 3:42

Tahrirlangan va faktlar tekshirilgan: 15 yil 2023-may, soat 3:42

Qisqacha

Mualliflar LLM dasturlari deb nomlangan muqobil yo'lni taklif qilishadi, uni kontekstda o'rganishni rivojlantirish deb hisoblash mumkin.

LLM dasturi orqali muammoni hal qilishning kaliti bu muammoning echimini oddiyroq qadamlar ketma-ketligiga ajratish qobiliyatidir.

LLM xususiylashtirishning ikkita asosiy yo'nalishi mavjud: oldindan o'rgatilgan asosiy modelni nozik sozlash (yoki qo'shimcha trening) va kontekstda o'rganish. Buni amalga oshirish uchun nozik sozlash muhim hisoblash resurslari, ma'lumotlar yig'ish va infratuzilmani talab qiladi va keyin nozik sozlangan modellarni qabul qiladi. Shu bilan birga, kontekstda o'rganish muammoni hal qilish misollari bilan to'g'ri taklifni tuzishni o'z ichiga oladi, masalan, Chain-of-Thought (CoT). Biroq, ba'zi qiyinchiliklar mavjud, masalan, modelga taqdim etilishi mumkin bo'lgan matnning cheklangan hajmi va murakkab ko'p o'tishli taklifda qadamlar bir-biriga xalaqit berishi va modelni nimadir chalg'itishi mumkin. Buni hozircha chalg'itmaslik kerak. Mualliflar deb nomlangan muqobil yo'lni taklif qilishadi LLM dasturlari, bu kontekstli ta'limning rivojlanishi sifatida qaralishi mumkin.

LLM dasturlari: murakkab vaziyatlarda neyron modellarni nozik sozlashning yangi yo'li

Tavsiya: Prompt Engineering Ultimate Guide 2023

LLM dasturga o'rnatilgan (odatda dasturlash tili, masalan, Pythonda). Ushbu tashqi kod holatni saqlash va modelni bosqichma-bosqich saqlash uchun javobgardir. Uning bir qancha asosiy afzalliklari bor: dasturlash tillari bunga moslashtirilgan, mavjud kontekst hajmi oshadi va qadamlar bir-biriga xalaqit bermaydi. LLM dasturi orqali muammoni hal qilishning kaliti bu muammoning echimini oddiyroq qadamlar ketma-ketligiga ajratish qobiliyatidir. Ushbu yondashuv oldingi ishlardan farq qiladi, bu erda model kalkulyator yoki kabi tashqi vositalardan foydalangan kod tarjimonlari davlatni saqlab qolish uchun. Ushbu yondashuv yaxshi, chunki u murakkab va keng tarqalgan vazifani shu tarzda tasvirlash mumkin, bu uni sinab ko'rish, disk raskadrovka va sifatni baholashni osonlashtiradi.

Bundan tashqari, bosqichlar o'rtasida hech qanday shovqin yo'q, bu LLM bilan ishlashni osonlashtiradi. Savol-javob tizimlari ham yangilik emas; ular LLMlardan ancha oldin mavjud bo'lgan. Savollarga javob berish vazifasi hozir qanday hal qilingan?

Saytlar tez-tez yangilanadi, shuning uchun a muzlatilgan model variant emas; u tezda eskiradi va yangi mahsulotlar haqidagi savollarga javob bera olmaydi. Har bir yangilanish uchun modelni doimiy ravishda qayta o'qitish haqiqiy variant emas: bu qimmat va ko'p vaqt talab qiladi. Buning o'rniga, veb-sayt sahifalari odatda indekslanadi, ma'lumotlar bazasiga joylashtiriladi va ko'pincha vektorlanadi. Foydalanuvchining iltimosiga ko'ra, tegishli hujjatlar olinadi va LLMga kontekst sifatida yuboriladi.

Bunday paradigmada muammo tabiiy ravishda LLM dasturi orqali hal qilinadi. Bonus sifatida mumkin bo‘ladi kontekstga to'liq mos kelmaydigan murakkabroq ko'p o'tishli mantiqni amalga oshirish.

da sinovdan o'tgan StrategyQA ma'lumotlar to'plami ikkilik tasniflash muammolarini o'z ichiga oladi, ularning yechimi ko'p tomonlama fikrlashni o'z ichiga oladi. "Quyosh nuri Qora dengizning eng chuqur joyiga kiradimi?" Javob berish uchun siz maksimal chuqurlikni (2 km) va yorug'lik suvga qanchalik chuqur kirib borishini (1 km) topishingiz kerak va keyin xulosa chiqarishingiz kerak. Keling, yana bir misol savolini ko'rib chiqaylik: "Aristotel noutbukdan foydalanganmi?" Bu savol unchalik sodda emas va "Noutbuk ixtiro qilinganida Aristotel tirikmidi?" Degandek fikrlash bosqichlari ketma-ketligiga aniq amal qilmaydi. qiladi. Ma'lumotlar to'plami bunday ketma-ketlik yashirin bo'lgan savollarga qaratilgan. Ma'lumotlar to'plamida atigi 2,780 ta savol mavjud, ulardan faqat 918 tasida fikrlashning barcha bosqichlarini mustahkamlovchi dalillarga ega paragraflar mavjud. Joriy ishda u ushbu kichik to'plamni cheklaydi; aks holda, biz tayyorgarlikdan oldin ba'zi faktlarni o'rganish LLMga tayanishimiz kerak edi.

OPT-175B LLM, sukut bo'yicha, ko'rsatmalarga amal qilishda unchalik yaxshi emas; u ko'rsatmalarni yoki suhbat ma'lumotlarini sozlashi shart emas edi. Dalillarga asoslangan savol-javob muammosini hal qilish uchun ma'lumotlarni filtrlash bosqichi va daraxtni qidirish bosqichiga bo'linadi.

Filtrlash bosqichida, savol tug'ilganda, ishlab chiquvchilar barcha paragraflarni ko'rib chiqadilar va eng mosini tanlaydilar. Misol uchun, bir necha marta o'q uzilgan holda, LLMdan berilgan paragraf berilgan savolga mos keladimi yoki yo'qmi (ha/yo'q) deb javob berishini so'rang. StrategyQA ning 300 ta kichik toʻplamida sinovdan oʻtgan, bunda har bir savol tegishli yoki mos boʻlmagan paragraf bilan 50/50 bilan moslangan. OPT-175B va text-davinci-002 da mavjud emas ancha yuqori sifat tasodifiy boshlang'ichga qaraganda: 56% gacha. Qanchalik rivojlangan 11B Tk-Instruct 61.6% da unchalik yaxshi emas.

Ushbu yondashuvning sifati pastligi sababli, matnning oldingi xatboshi bilan birgalikda savolning o'rtacha salbiy log-ehtimolini (NLL) ko'rib chiqadigan va keyin natijalarni tartiblovchi alternativa birlashtirildi. Har bir savol uchun 100 ta paragraf bo'lgan va faqat bittasi tegishli bo'lgan ma'lumotlar to'plamida baholangan (shuning uchun tasodifiy taxmin 1% ni beradi). Biz birinchi o'rinni 1 foizda va eng yaxshi beshlikni 79 foizda oldik. Ushbu hisob-kitob uchun odatda modelning o'ziga kirish kerak, bu har doim ham APIda bajarilmaydi.

Keyinchalik chiqish zanjirlarini qurish bosqichi keladi. Bu savolning ildizi bo'lgan daraxt bo'ylab qidirish orqali amalga oshiriladi va har bir darajada keyingi qadamni yaratish uchun kontekst sifatida foydalanish mumkin bo'lgan dalillarga ega ko'plab paragraflar mavjud. Daraxtdan o'tadigan har bir yo'l potentsial chiqish zanjiridir. Barcha mumkin bo'lgan zanjirlar bo'yicha xulosa chiqarish haqiqiy emas, shuning uchun barcha mavjud zanjirlar tartiblangan va eng yuqori darajali zanjir kengaytirilgan. Bu nurni qidirishning bunday o'zgarishi. Javob berilganda yoki maksimal ruxsat etilgan qadamlar soni o'tganda jarayon to'xtaydi.

Eng muhim tafsilotlar daraxtni qidirish bosqichi uchun sinovdan o'tgan ikkita reyting strategiyasidir. Birinchi strategiya butun zanjirning o'rtacha NLL ga asoslanadi, ikkinchi strategiya esa paragrafli va paragrafsiz (P), savolli va savolsiz (Q) NLL ning o'rtacha farqiga qaraydi. StrategyQA ning mavjud 918 ta savoliga bu yondashuv CoT (60%) bilan asosiyga nisbatan javob sifatini sezilarli darajada yaxshilaydi; Ikkala qidiruv varianti ham taxminan 66% ni beradi (bir oz yuqori deltaga ega strategiya). Agar oltin faktlar taqdim etilsa, sifat 81% atrofida bo'ladi, bu OPT uchun yuqori chegara hisoblanadi. Darklang u yerga ketayotganga o'xshaydi, lekin biroz boshqacha yo'l bilan.

Maqola Telegram’ga asoslangan post.

AI haqida ko'proq o'qing:

Tags:

Masʼuliyatdan voz kechish

Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.

Muallif haqida

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.

Boshqa maqolalar

Damir Yalolov

Hot Stories

CARV o'zining ma'lumotlar qatlamini markazsizlashtirish va mukofotlarni tarqatish uchun Aethir bilan hamkorlikni e'lon qiladi

by Alisa Devidson

, 03 2024 mumkin

So'nggi yangiliklar

CARV o'zining ma'lumotlar qatlamini markazsizlashtirish va mukofotlarni tarqatish uchun Aethir bilan hamkorlikni e'lon qiladi

by Alisa Devidson

, 03 2024 mumkin

Institutsional ishtaha o'zgaruvchanlik sharoitida Bitcoin ETFlariga nisbatan o'sib bormoqda

13F arizalari orqali oshkor qilish Bitcoin ETFs bilan shug'ullanadigan taniqli institutsional investorlarni ochib beradi, bu esa tobora ortib borayotgan qabul qilinishini ta'kidlaydi ...

Ko'proq ma'lumot oling