Uutisraportti Elektroniikka
Helmikuu 06, 2023

XLM-V: Uusi menetelmä monikielisille naamiokielimalleille, joka yrittää ratkaista sanaston pullonkaulaongelman

Lyhyesti

Artikkeli herättää seuraavan ongelman: kielimalleja parametrien kasvu, syvyys kasvaa, mutta sanasto on silti samankokoinen.

Tutkijat alkavat kouluttaa uutta mallia, jossa on miljoona sanastoa odottamattomalla tavalla.

Tutkijat päättivät nähdä, millaista parannusta he voisivat tehdä niin merkittävällä rahakkeiden lisäyksellä.

Ongelma, jonka esitti artikkeli "XLM-V: Sanaston pullonkaulan voittaminen monikielisissä naamioituneissa kielimalleissa" on se, että kun kielimallien parametrit ja syvyys kasvavat, niiden sanaston koko pysyy ennallaan. Esimerkiksi mT5-mallissa on 13B parametreja, mutta 250 100 sanan sanasto, joka tukee yli 2,500 kieltä. Jokaisella kielellä on siis noin XNUMX XNUMX yksilöllistä merkkiä, mikä on ilmeisesti hyvin pieni määrä.

XLM-V: Uusi monikielisten peitettujen kielimallien menetelmä, joka yrittää ratkaista sanaston pullonkaulan ongelman
@ Midjourney / Shalv

Mihin toimiin kirjoittajat ryhtyvät? He alkavat kouluttaa uutta mallia, jossa on 1 miljoona sanastoa odottamattomalla tavalla. XLM-R oli olemassa aiemmin, mutta tämän päivityksen myötä siitä tulee XLM-V. Kirjoittajat olivat päättäneet nähdä, millaisia ​​parannuksia he voisivat tehdä niin merkittävällä rahakkeiden lisäyksellä.

Aiheeseen liittyvä artikkeli: Tekoälymallin koulutuskustannusten odotetaan nousevan 100 miljoonasta 500 miljoonaan dollariin vuoteen 2030 mennessä

Entä XLM-V on uusi, jota XLM-R ei tehnyt?

Entä XLM-V on uusi, jota XLM-R ei tehnyt?

Paraneminen Monikieliset mallit Language-Clustered Vocabularies -menetelmää käytetään leksikaalisten esitysvektorien rakentamiseen kullekin kielelle seuraavasti: jokaiselle kielijoukon kielelle ne muodostavat binäärivektorin, jonka jokainen elementti on tietty sana kielessä. Yksi osoittaa, että sana on sisällytetty kielen sanakirjaan (voit tarkastella kuvaa graafisella kuvauksella liitteissä.) Kuitenkin luomalla vektorin, joka hyödyntää kunkin lekseemin negatiivista logaritmista esiintymistodennäköisyyttä, kirjoittajat parantavat viittausten tekemistä. .

  1. Vektorit ryhmitellään tämän jälkeen. Lisäksi jokaisessa klusterissa opetetaan lausekappalemalli, joka estää sanaston siirron leksiaalisesti toisiinsa liittymättömien kielten välillä.
  2. ALP arvioi sanakirjan kyvyn edustaa tiettyä kieltä.
  3. Algoritmin käyttäminen luomiseen Ulm sanakirjat on seuraava vaihe. joka alkaa suurella alkusanakirjalla ja leikkaa sitä asteittain alaspäin, kunnes merkkien määrä on alle tietyn sanakirjan koon kynnyksen.

Lue lisää tekoälystä:

Tunnisteet:

Vastuun kieltäminen

Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.

Author

Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa. 

lisää artikkeleita
Damir Yalalov
Damir Yalalov

Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa. 

Institutionaalinen ruokahalu kasvaa kohti Bitcoin ETF:iä volatiliteetin keskellä

13F-hakemusten kautta tehdyt ilmoitukset paljastavat merkittäviä institutionaalisia sijoittajia, jotka harrastavat Bitcoinin ETF:itä, mikä korostaa kasvavaa hyväksyntää ...

Tiedä enemmän

Tuomiopäivä saapuu: CZ:n kohtalo on tasapainossa, kun Yhdysvaltain tuomioistuin harkitsee DOJ:n vetoomusta

Changpeng Zhao odottaa tänään tuomiota Yhdysvaltain oikeudessa Seattlessa.

Tiedä enemmän
Liity innovatiiviseen teknologiayhteisöömme
Lue lisää
Lue lisää
Injective yhdistää voimansa AltLayerin kanssa tuodakseen Restakingin turvallisuuden inEVM:ään
Bisnes Uutisraportti Elektroniikka
Injective yhdistää voimansa AltLayerin kanssa tuodakseen Restakingin turvallisuuden inEVM:ään
Voi 3, 2024
Masa tekee yhteistyötä Tellerin kanssa ottaakseen käyttöön MASA-lainauspoolin, mikä mahdollistaa USDC-lainauksen pohjalta
markkinat Uutisraportti Elektroniikka
Masa tekee yhteistyötä Tellerin kanssa ottaakseen käyttöön MASA-lainauspoolin, mikä mahdollistaa USDC-lainauksen pohjalta
Voi 3, 2024
Velodrome julkaisee Superchain Beta -version tulevina viikkoina ja laajenee OP Stack Layer 2 -lohkoketjuihin
markkinat Uutisraportti Elektroniikka
Velodrome julkaisee Superchain Beta -version tulevina viikkoina ja laajenee OP Stack Layer 2 -lohkoketjuihin
Voi 3, 2024
CARV ilmoittaa yhteistyöstä Aethirin kanssa tietokerroksen hajauttamiseksi ja palkintojen jakamiseksi
Bisnes Uutisraportti Elektroniikka
CARV ilmoittaa yhteistyöstä Aethirin kanssa tietokerroksen hajauttamiseksi ja palkintojen jakamiseksi
Voi 3, 2024
CRYPTOMERIA LABS PTE. OY.