Aprel 05, 2023

Katta til modellari haqida bilishingiz kerak bo'lgan 8 ta narsa

Nashr qilingan: 05 yil 2023 aprel, 4:29 Yangilangan: 05 yil 2023 aprel, 4:30

Qisqacha

Katta til modellari (LLMlar) tabiiy tilning nuanslarini o'rganish, mashinalarning matnni tushunish va yaratish qobiliyatini yaxshilash, ovozni aniqlash va mashina tarjimasi kabi vazifalarni avtomatlashtirish uchun ishlatiladi.

LLMlarni boshqarishning oson yechimi yo'q, lekin ular xuddi odamlar kabi qobiliyatga ega.

Tabiiy tillarni qayta ishlash va undan biznesda foydalanish rivojlanishining jadal rivojlanishi bilan katta til modellariga qiziqish ortib bormoqda. Ushbu modellar tabiiy tilning nuanslarini o'rganish, mashinalarning matnni tushunish va yaratish qobiliyatini yaxshilash hamda ovozni aniqlash va mashina tarjimasi kabi vazifalarni avtomatlashtirish uchun ishlatiladi. Katta til modellari (LLM) haqida bilishingiz kerak bo'lgan sakkizta muhim narsa.

Katta til modellari haqida bilishingiz kerak bo'lgan 10 ta narsa — @Midjourney / Taka # 4076

Mundarija

Xarajatlar oshib borishi sababli LLMlar ko'proq "qobiliyatli"
Qanday qilib tezda ko'rib chiqing GPT ta'lim xarajatlari oshishi bilan modellar moslashadi
LLMlar tashqi dunyo vakillaridan foydalangan holda stol o'yinlarini o'ynashni o'rganadilar
LLMni boshqarishning oson yechimi yo'q
Mutaxassislar LLM qanday ishlashini tushuntirishda qiynalmoqda
LLMlar ham odamlar kabi qobiliyatga ega
LLMlar shunchaki "barcha savdolar" emas, balki ko'proq bo'lishi kerak
Modellar odamlarning birinchi taassurotlari asosida o'ylaganidan ko'ra "aqlliroq"

Xarajatlar oshib borishi sababli LLMlar ko'proq "qobiliyatli"

LLMlar, hatto ajoyib innovatsiyalarsiz ham, xarajatlarning oshishi bilan "qobiliyatli" bo'lib qoladi. Bu erda asosiy narsa - bu maqolada ko'rsatilgan bashoratlilik GPT-4: beshdan ettigacha kichik modellar yakuniy 0.1% byudjet bilan o'qitildi va shundan so'ng katta model uchun bashorat qilindi. Bitta aniq vazifaning kichik namunasi bo'yicha chalkashlik va ko'rsatkichlarni umumiy baholash uchun bunday bashorat juda to'g'ri edi. Ushbu bashoratlilik o'z faoliyati uchun LLMlarga tayanadigan korxonalar va tashkilotlar uchun muhimdir, chunki ular tegishli ravishda byudjet tuzishlari va kelajakdagi xarajatlarni rejalashtirishlari mumkin. Ammo shuni ta'kidlash kerakki, xarajatlarning oshishi imkoniyatlarning yaxshilanishiga olib kelishi mumkin bo'lsa-da, yaxshilanish tezligi oxir-oqibat yuqori darajaga ko'tarilishi mumkin, bu esa rivojlanishni davom ettirish uchun yangi innovatsiyalarga sarmoya kiritishni talab qiladi.

Qanday qilib tezda ko'rib chiqing GPT ta'lim xarajatlari oshishi bilan modellar moslashadi

Biroq, o'ziga xos muhim ko'nikmalar o'sishning yon mahsuloti sifatida oldindan aytib bo'lmaydigan tarzda paydo bo'ladi ta'lim xarajatlari (uzoqroq ta'lim, ko'proq ma'lumot, katta model) — modellar qachon muayyan vazifalarni bajarishni boshlashini oldindan aytish deyarli mumkin emas. Biz mavzuni o'zimizda chuqurroq o'rganib chiqdik Maqola ning rivojlanish tarixi haqida GPT modellar. Rasmda turli vazifalar bo'yicha modellar sifatini oshirishning taqsimlanishi ko'rsatilgan. Bu faqat katta modellar turli vazifalarni bajarishni o'rganishi mumkin. Ushbu grafik o'lchamini kattalashtirishning sezilarli ta'sirini ta'kidlaydi GPT Modellari turli vazifalarni bajarishda ularning bajarilishi haqida. Ammo shuni ta'kidlash kerakki, bu hisoblash resurslarining ko'payishi va atrof-muhitga ta'siri xarajati bilan bog'liq.

LLMlar tashqi dunyo vakillaridan foydalangan holda stol o'yinlarini o'ynashni o'rganadilar

LLMlar ko'pincha tashqi dunyo vakillarini o'rganadilar va foydalanadilar. Bu erda ko'plab misollar mavjud va ulardan biri: Modellar o'qitilgan o'yin maydonining rasmini ko'rmasdan, individual harakatlar tavsifiga asoslangan stol o'yinlarini o'ynash, har bir harakatda taxta holatining ichki tasvirlarini o'rganish. Keyinchalik bu ichki tasvirlardan foydalanish mumkin kelajakni bashorat qilish harakatlar va natijalar, modelga o'yinni yuqori darajada o'ynashga imkon beradi. Vakillarni o'rganish va ulardan foydalanish qobiliyati kalit hisoblanadi mashinani o'rganish jihati va sun'iy intellekt.

LLMni boshqarishning oson yechimi yo'q

LLM xatti-harakatlarini boshqarishning ishonchli usullari mavjud emas. Turli muammolarni tushunish va yumshatishda ma'lum yutuqlarga erishilgan bo'lsa-da (shu jumladan ChatGPT va GPT-4 fikr-mulohazalar yordamida), biz ularni hal qila olamizmi yoki yo'qmi, konsensus yo'q. Kelajakda bundan ham kattaroq tizimlar yaratilsa, bu katta, potentsial halokatli muammoga aylanishidan xavotirlar kuchaymoqda. Shu sababli, tadqiqotchilar AI tizimlari insoniy qadriyatlar va maqsadlarga mos kelishini ta'minlash uchun yangi usullarni o'rganmoqdalar, masalan, qiymatlarni moslashtirish va mukofotlash muhandisligi. Biroq, kafolat berish qiyin vazifa bo'lib qolmoqda LLMlarning xavfsizligi va ishonchliligi murakkab real dunyo stsenariylarida.

Ko'proq o'qing: OpenAI Yaxshilash uchun 50 dan ortiq ekspertlar guruhini yig'adi GPT-4ning xavfsizligi

Mutaxassislar LLM qanday ishlashini tushuntirishda qiynalmoqda

Mutaxassislar hali LLMning ichki ishini izohlay olmaydilar. Hech qanday uslub bizga biron bir natijani yaratganda qanday bilim, fikrlash yoki maqsadlardan foydalanishini aniq aytishga imkon bermaydi. Ushbu izohlanmaslik LLM qarorlarining ishonchliligi va adolatliligi, ayniqsa, jinoiy sudlov yoki kredit reytingi kabi yuqori talablarga ega bo'lgan ilovalarda tashvish tug'diradi. Shuningdek, u yanada shaffof va hisobdor AI modellarini ishlab chiqish bo'yicha keyingi tadqiqotlar zarurligini ta'kidlaydi.

LLMlar ham odamlar kabi qobiliyatga ega

Garchi LLMlar birinchi navbatda o'qitiladi matn yozishda inson xatti-harakatlariga taqlid qilish, ular ko'p vazifalarda bizdan o'zib ketish salohiyatiga ega. Buni shaxmat yoki Go o'ynashda allaqachon ko'rish mumkin. Bu ularning katta hajmdagi ma'lumotlarni tahlil qilish va shu tahlil asosida odamlar tenglasha olmaydigan tezlikda qaror qabul qilish qobiliyati bilan bog'liq. Biroq, LLMlar hali ham odamlarda mavjud bo'lgan ijodkorlik va sezgiga ega emas, bu ularni ko'p vazifalar uchun kamroq moslashtiradi.

Ko'proq o'qing: OpenAI Yaxshilash uchun 50 dan ortiq ekspertlar guruhini yig'adi GPT-4ning xavfsizligi

LLMlar shunchaki "barcha savdolar" emas, balki ko'proq bo'lishi kerak

LLMlar o'z yaratuvchilarining qiymatlarini yoki Internetdagi tanlovda kodlangan qiymatlarni ifodalamasligi kerak. Ular stereotiplarni yoki fitna nazariyalarini takrorlamasliklari yoki hech kimni xafa qilmasliklari kerak. Buning o'rniga, LLMlar madaniy va ijtimoiy farqlarni hurmat qilgan holda o'z foydalanuvchilariga xolis va faktik ma'lumotlarni taqdim etish uchun mo'ljallangan bo'lishi kerak. Bundan tashqari, ular ushbu standartlarga javob berishda davom etishlarini ta'minlash uchun muntazam sinov va monitoringdan o'tishlari kerak.

Modellar odamlarning birinchi taassurotlari asosida o'ylaganidan ko'ra "aqlliroq"

Birinchi taassurotlarga asoslangan modelning qobiliyatini baholash ko'pincha noto'g'ri bo'ladi. Ko'pincha siz to'g'ri taklifni o'ylab topishingiz, modelni taklif qilishingiz va ehtimol misollar ko'rsatishingiz kerak va u ancha yaxshi uddalana boshlaydi. Ya'ni, u birinchi qarashda ko'rinadiganidan ko'ra "aqlli". Shuning uchun modelga adolatli imkoniyat berish va uni eng yaxshi ishlashi uchun zarur resurslar bilan ta'minlash juda muhimdir. To'g'ri yondashuv bilan, hatto noadekvat ko'rinadigan modellar ham bizni o'z imkoniyatlari bilan ajablantirishi mumkin.

Agar biz BIG-Bench ma'lumotlar to'plamidan 202 ta topshiriq namunasiga e'tibor qaratadigan bo'lsak (uni sinab ko'rish maxsus qiyinlashtirilgan edi) til modellari dan vagacha), keyin qoida tariqasida (o'rtacha), modellar o'sib borayotgan masshtab bilan sifatning oshishini ko'rsatadi, lekin individual ravishda vazifalardagi ko'rsatkichlar:

asta-sekin yaxshilanadi,
keskin yaxshilash,
o'zgarishsiz qoladi,
pasayish,
korrelyatsiya ko'rsatmaydi.

Bularning barchasi kelajakdagi tizimning ishlashini ishonchli tarzda ekstrapolyatsiya qilishning mumkin emasligiga olib keladi. Yashil qism ayniqsa qiziq - aynan shu erda sifat ko'rsatkichlari hech qanday sababsiz keskin ko'tariladi.

AI haqida ko'proq o'qing:

Tags:

Masʼuliyatdan voz kechish

Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.

Muallif haqida

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.

Boshqa maqolalar

Damir Yalolov

Hot Stories

Crypto Exchange Bybit Ethena Labs'ning USDe-ni garov aktivi sifatida birlashtiradi, BTC-USDe va ETH-USDe savdo juftliklariga imkon beradi

by Alisa Devidson

, 07 2024 mumkin

So'nggi yangiliklar

Orbiter Finance Bitcoin Layer 2 Zulu tarmog'i bilan hamkorlik qiladi va Is Lwazi Testnet tarmog'ida ishlaydi

by Alisa Devidson

, 07 2024 mumkin

Crypto Exchange Bybit Ethena Labs'ning USDe-ni garov aktivi sifatida birlashtiradi, BTC-USDe va ETH-USDe savdo juftliklariga imkon beradi

by Alisa Devidson

, 07 2024 mumkin

Bitget Wallet GetDrop-ni taqdim etadi Airdrop Platforma va 130,000 XNUMX AQSh dollari mukofot jamg'armasiga ega bo'lgan birinchi meme tanga tadbirini boshladi

by Alisa Devidson

, 07 2024 mumkin

Meson tarmog'i kripto konchilarga kon orqali tokenlarni olish imkonini beradi. Airdrops Va qayta sotib olish dasturlari keladi

by Alisa Devidson

, 07 2024 mumkin

Institutsional ishtaha o'zgaruvchanlik sharoitida Bitcoin ETFlariga nisbatan o'sib bormoqda

13F arizalari orqali oshkor qilish Bitcoin ETFs bilan shug'ullanadigan taniqli institutsional investorlarni ochib beradi, bu esa tobora ortib borayotgan qabul qilinishini ta'kidlaydi ...

Ko'proq ma'lumot oling