Yangiliklar hisoboti texnologiya
Fevral 06, 2023

XLM-V: So'z boyligi muammosini hal qilishga urinadigan ko'p tilli niqoblangan til modellarining yangi usuli

Qisqacha

Maqolada quyidagi muammo ko'tariladi: til modellari parametrlarni oshirish, chuqurlikda o'sish, lekin lug'at hajmi hali ham bir xil.

Tadqiqotchilar kutilmagan tarzda lug'atdan 1 million tokenga ega yangi modelni tayyorlashni boshlaydilar.

Tadqiqotchilar tokenlarning bunday sezilarli o'sishi bilan qanday yaxshilanishlarni ko'rishga qaror qilishdi.

tomonidan ko'tarilgan masala Maqola “XLM-V: Ko‘p tilli niqoblangan til modellarida lug‘at darbog‘ini yengish” deb nomlangan bo‘lib, til modellarining parametrlari va chuqurligi oshganda, ularning lug‘at hajmi o‘zgarishsiz qoladi. Misol uchun, mT5 modeli 13B parametrga ega, ammo 250 dan ortiq tillarni qo'llab-quvvatlaydigan 100K so'zli lug'atga ega. Shunday qilib, har bir tilda taxminan 2,500 ta noyob token mavjud, bu juda kichik raqam.

XLM-V: Ko'p tilli niqoblangan til modellarining yangi usuli, so'z boyligi muammosini hal qilishga harakat qiladi.
@ Midjourney / Shalv

Mualliflar qanday choralar ko'radi? Ular kutilmagan tarzda lug'atdan 1 million token bilan yangi modelni o'rgatishni boshlaydilar. XLM-R ilgari mavjud edi, ammo bu yangilanish bilan u XLM-Vga aylanadi. Yozuvchilar tokenlarning bunday sezilarli o'sishi bilan qanday yaxshilanishlarni ko'rishga qaror qilishdi.

O'xshash maqola: 100-yilga borib sunʼiy intellekt modelini oʻqitish xarajatlari 500 million dollardan 2030 million dollargacha oshishi kutilmoqda.

XLM-V haqida nima deyish mumkin, XLM-R yangi emas?

XLM-V haqida nima deyish mumkin, XLM-R yangi emas?

Yaxshilash Ko'p tilli modellar Til-klasterli lug'atlar usuli bilan har bir til uchun leksik ifoda vektorlarini quyidagicha qurish uchun foydalaniladi: tillar to'plamidagi har bir til uchun ular ikkilik vektorni tashkil qiladi, ularning har bir elementi tildagi o'ziga xos so'zdir. Ulardan biri bu so‘z tilning lug‘atiga kiritilganligini bildiradi (siz qo‘shimchalarda grafik tavsifi bilan tasvirni ko‘rishingiz mumkin.) Biroq, har bir leksemaning paydo bo‘lishining manfiy logarifmik ehtimolidan foydalangan holda vektor yaratish orqali mualliflar murojaat qilish usullarini yaxshilaydilar. .

  1. Vektorlar shundan keyin guruhlanadi. Bundan tashqari, leksik jihatdan bir-biriga bog'liq bo'lmagan tillar o'rtasida lug'atning o'tkazilishini to'xtatish uchun har bir alohida klasterda jumla modeli o'qitiladi.
  2. ALP lug'atning ma'lum bir tilni ifodalash qobiliyatini baholaydi.
  3. Yaratish algoritmidan foydalanish Ultra yengil lug'atlar keyingi bosqichdir. Bu katta boshlang'ich lug'at bilan boshlanadi va tokenlar soni lug'at hajmi uchun ma'lum bir chegaradan past bo'lgunga qadar uni bosqichma-bosqich qisqartiradi.

AI haqida ko'proq o'qing:

Masʼuliyatdan voz kechish

Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.

Muallif haqida

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi. 

Boshqa maqolalar
Damir Yalolov
Damir Yalolov

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi. 

Institutsional ishtaha o'zgaruvchanlik sharoitida Bitcoin ETFlariga nisbatan o'sib bormoqda

13F arizalari orqali oshkor qilish Bitcoin ETFs bilan shug'ullanadigan taniqli institutsional investorlarni ochib beradi, bu esa tobora ortib borayotgan qabul qilinishini ta'kidlaydi ...

Ko'proq ma'lumot oling

Hukm chiqarish kuni keldi: AQSh sudi DOJning iltimosini ko'rib chiqayotgani sababli CZ taqdiri muvozanatda.

Changpeng Chjao bugun AQShning Sietldagi sudida hukm chiqarilishiga tayyor.

Ko'proq ma'lumot oling
Innovatsion texnologiyalar hamjamiyatimizga qo'shiling
Ko'proq o'qing
Ko'proq o'qing
Injective inEVM-ga qayta tiklash xavfsizligini olib kelish uchun AltLayer bilan kuchlarni birlashtiradi
ish Yangiliklar hisoboti texnologiya
Injective inEVM-ga qayta tiklash xavfsizligini olib kelish uchun AltLayer bilan kuchlarni birlashtiradi
, 3 2024 mumkin
Masa, MASA kreditlash pulini joriy qilish uchun kassa bilan hamkorlik qiladi, USDC asosida qarz olishga imkon beradi
Birja Yangiliklar hisoboti texnologiya
Masa, MASA kreditlash pulini joriy qilish uchun kassa bilan hamkorlik qiladi, USDC asosida qarz olishga imkon beradi
, 3 2024 mumkin
Velodrome kelgusi haftalarda Superchain beta-versiyasini ishga tushiradi va OP Stack Layer 2 blokcheynlarida kengayadi
Birja Yangiliklar hisoboti texnologiya
Velodrome kelgusi haftalarda Superchain beta-versiyasini ishga tushiradi va OP Stack Layer 2 blokcheynlarida kengayadi
, 3 2024 mumkin
CARV o'zining ma'lumotlar qatlamini markazsizlashtirish va mukofotlarni tarqatish uchun Aethir bilan hamkorlikni e'lon qiladi
ish Yangiliklar hisoboti texnologiya
CARV o'zining ma'lumotlar qatlamini markazsizlashtirish va mukofotlarni tarqatish uchun Aethir bilan hamkorlikni e'lon qiladi
, 3 2024 mumkin
CRYPTOMERIA LABS PTE. LTD.