Новински извештај технологија
06. фебруара 2023. године

КСЛМ-В: Нови метод вишејезичних маскираних језичких модела који покушава да реши проблем уског грла речника

Укратко

Чланак покреће следећи проблем: језички модели повећање параметара, раст у дубину, али је речник и даље исте величине.

Истраживачи почињу да обучавају нови модел са милион токена из речника на неочекиван начин.

Истраживачи су били одлучни да виде какву врсту побољшања могу направити са тако значајним повећањем токена.

Питање које је покренуо чланак под насловом „КСЛМ-В: Превазилажење уског грла речника у вишејезичним маскираним језичким моделима“ је да када се параметри језичких модела и дубина повећају, њихове величине речника остају непромењене. На пример, мТ5 модел има 13Б параметара, али речник од 250 речи који подржава више од 100 језика. Дакле, сваки језик има приближно 2,500 јединствених токена, што је очигледно веома мали број.

КСЛМ-В: Нова метода вишејезичних маскираних језичких модела која покушава да реши проблем уског грла речника
@ Midjourney / Схалв

Коју акцију предузимају аутори? Почињу да обучавају нови модел са милион токена из речника на неочекиван начин. КСЛМ-Р је раније постојао, међутим, са овом надоградњом, постаће КСЛМ-В. Писци су били одлучни да виде какву врсту побољшања могу направити са тако значајним повећањем токена.

Повезани чланак: Очекује се да ће трошкови обуке АИ модела порасти са 100 милиона долара на 500 милиона долара до 2030.

Шта је са новим КСЛМ-В који КСЛМ-Р није?

Шта је са новим КСЛМ-В који КСЛМ-Р није?

Тхе Импровинг Вишејезични модели витх Лангуаге-Цлустеред Воцабулариес метода се користи за конструисање вектора лексичке репрезентације за сваки језик на следећи начин: за сваки језик у скупу језика они чине бинарни вектор, чији је сваки елемент специфична реч у језику. Један указује на то да је реч укључена у речник језика (слику са графичким описом можете погледати у прилозима.) Међутим, креирањем вектора који користи негативну логаритамску вероватноћу појављивања сваке лексеме, аутори побољшавају начин на који се референце праве .

  1. После тога се вектори групишу. Поред тога, модел реченичног дела се обучава на сваком одређеном кластеру како би се зауставио пренос речника између лексички неповезаних језика.
  2. АЛП процењује способност речника да представља одређени језик.
  3. Користећи алгоритам за креирање УЛМ речници је следећи корак. који почиње великим почетним речником и постепено га скраћује све док број токена не буде испод одређеног прага за величину речника.

Прочитајте више о АИ:

Одрицање од одговорности

У складу са Смернице пројекта Труст, имајте на уму да информације дате на овој страници нису намењене и не треба да се тумаче као правни, порески, инвестициони, финансијски или било који други облик савета. Важно је да инвестирате само оно што можете приуштити да изгубите и да тражите независан финансијски савет ако сумњате. За додатне информације, предлажемо да погледате одредбе и услове, као и странице помоћи и подршке које пружа издавач или оглашивач. MetaversePost је посвећен тачном, непристрасном извештавању, али тржишни услови су подложни променама без претходне најаве.

О аутору

Дамир је вођа тима, менаџер производа и уредник у Metaverse Post, покривајући теме као што су АИ/МЛ, АГИ, ЛЛМ, Метаверсе и Web3-сродна поља. Његови чланци привлаче огромну публику од преко милион корисника сваког месеца. Чини се да је стручњак са 10 година искуства у СЕО и дигиталном маркетингу. Дамир се помиње у Масхабле, Виред, Cointelegraph, Тхе Нев Иоркер, Инсиде.цом, Ентрепренеур, БеИнЦрипто и друге публикације. Путује између УАЕ, Турске, Русије и ЗНД као дигитални номад. Дамир је стекао диплому физике, за коју верује да му је дало вештине критичког размишљања које су му потребне да буде успешан у свету интернета који се стално мења. 

više чланака
Дамир Иалалов
Дамир Иалалов

Дамир је вођа тима, менаџер производа и уредник у Metaverse Post, покривајући теме као што су АИ/МЛ, АГИ, ЛЛМ, Метаверсе и Web3-сродна поља. Његови чланци привлаче огромну публику од преко милион корисника сваког месеца. Чини се да је стручњак са 10 година искуства у СЕО и дигиталном маркетингу. Дамир се помиње у Масхабле, Виред, Cointelegraph, Тхе Нев Иоркер, Инсиде.цом, Ентрепренеур, БеИнЦрипто и друге публикације. Путује између УАЕ, Турске, Русије и ЗНД као дигитални номад. Дамир је стекао диплому физике, за коју верује да му је дало вештине критичког размишљања које су му потребне да буде успешан у свету интернета који се стално мења. 

Hot Stories
Придружите се нашем билтену.
Најновије вести

Институционални апетит расте према Битцоин ЕТФ-овима усред волатилности

Откривања путем 13Ф поднесака откривају значајне институционалне инвеститоре који се баве Битцоин ЕТФ-овима, наглашавајући све веће прихватање ...

Знате више

Стиже дан изрицања пресуде: Судбина ЦЗ-а виси у равнотежи док амерички суд разматра изјашњење Министарства правде

Цхангпенг Зхао се данас суочава са изрицањем казне на америчком суду у Сијетлу.

Знате више
Придружите се нашој заједници иновативних технологија
Опширније
opširnije
Ињецтиве удружује снаге са АлтЛаиер-ом како би донео сигурност поновног уметања у инЕВМ
Posao Новински извештај технологија
Ињецтиве удружује снаге са АлтЛаиер-ом како би донео сигурност поновног уметања у инЕВМ
Може 3, 2024
Маса се удружује са Теллером како би увела МАСА фонд за зајмове, омогућавајући УСДЦ позајмљивање на бази
tržišta Новински извештај технологија
Маса се удружује са Теллером како би увела МАСА фонд за зајмове, омогућавајући УСДЦ позајмљивање на бази
Може 3, 2024
Велодроме лансира Суперцхаин Бета верзију у наредним недељама и проширује се преко ОП Стацк Лаиер 2 Блоцкцхаинс-а
tržišta Новински извештај технологија
Велодроме лансира Суперцхаин Бета верзију у наредним недељама и проширује се преко ОП Стацк Лаиер 2 Блоцкцхаинс-а
Може 3, 2024
ЦАРВ најављује партнерство са Аетхир-ом како би децентрализовао свој слој података и поделио награде
Posao Новински извештај технологија
ЦАРВ најављује партнерство са Аетхир-ом како би децентрализовао свој слој података и поделио награде
Може 3, 2024
ЦРИПТОМЕРИА ЛАБС ПТЕ. ЛТД.