Naujienų ataskaita Technologija
Gali 23, 2023

„Meta“ sukūrė atvirojo kodo kalbos AI, atpažįstančią daugiau nei 4,000 šnekamų kalbų

Trumpai

Įmonės MMS projektas gali atpažinti daugiau nei 4,000 kalbų.

Kaip ir dauguma kitų viešai paskelbtų AI projektų, „Meta“ dalijasi savo modeliais ir kodu, kad padėtų išsaugoti kalbų įvairovę.

Šiuo darbu jie tikisi šiek tiek prisidėti prie neįtikėtinos pasaulio kalbų įvairovės išsaugojimo.

meta sukūrė AI kalbos modelis, kuris yra gaivus posūkis ChatGPT. Atvirojo kodo MMS projektas buvo sukurtas siekiant išsaugoti kalbų įvairovę ir skatinti mokslinius tyrimus ir gali atpažinti daugiau nei 4,000 1,100 šnekamų kalbų ir sukurti tekstą (kalbą) daugiau nei XNUMX XNUMX kalbų. Įmonė turi viešai išleistas savo modelius ir kodą šiandien, kad pasiektų savo tikslus.

„Mes viešai dalijamės savo kūriniais ir kodu, kad paskatintume kitus mokslo bendruomenės narius remtis mūsų darbu“, – rašė Meta. „Šiomis pastangomis tikimės išsaugoti didžiulę pasaulio kalbų įvairovę.

„Meta“ sukūrė atvirojo kodo kalbos AI, atpažįstančią daugiau nei 4,000 šnekamų kalbų

Būdingi sunkumai mokant kalbos atpažinimo įrenginius ir teksto į kalbą modelius dideliems garso kiekiams be transkripcijos etikečių. Etiketės yra labai svarbios mašininis mokymasis, kuris gali teisingai identifikuoti ir klasifikuoti duomenis. Tačiau kalboms, kurios išnyks per ateinančius dešimtmečius, „šių duomenų tiesiog nėra“, kaip aiškina Meta.

Meta naudojo religinių tekstų garso įrašus, kad rinktų duomenis netradiciniu būdu. „Naudojome religinių tekstų, pvz., Biblijos, vertimus, kurie buvo plačiai ištirti atliekant teksto kalbos vertimo tyrimus daugeliu kalbų, nes jie verčiami į daugybę skirtingų kalbų“, – teigė bendrovė. Iš viešai prieinamų vertimų ištraukėme garso įrašus, kuriuose žmonės skaito šiuos tekstus įvairiomis kalbomis. „Meta“ tyrėjai prie jo pridėjo daugiau nei 4,000 kalbų modelis.

Šis požiūris skamba kaip labai šališko AI modelio, kuris palankiai vertina krikščionišką pasaulėžiūrą, receptas. Tačiau prieš šaipydamiesi iš šios idėjos, apsvarstykite ją Metos požiūriu: mokslininkai mano, kad taip yra, nes jie naudoja konnekcionistinį CTC laiko klasifikavimą (arba sekos į seką arba sekos tipo modelį), kuris yra daug labiau ribotas. skaičiavimo galios, palyginti su didelių kalbų modeliai (taip pat žinomi kaip sekos tipai) arba nuoseklūs kalbos atpažinimo modeliai. Meta teigia, kad dėl to daugumos vyrų kalbėtojų įrašytuose religiniuose įrašuose nebuvo vyrų šališkumo.

Meta naudojo wav2vec 2.0, „savarankiškai prižiūrimą kalbos vaizdavimo mokymosi“ modelį, kad apmokytų wav2vec 2.0 derinimo modelis todėl duomenys tampa naudingesni. Savarankiškai prižiūrimas kalbos modelis, kurį Meta savarankiškai prižiūrėjo iš nepažymėtų duomenų, davė puikių rezultatų. Meta nustatė, kad masiniai daugiakalbių kalbų modeliai veikė gerai, palyginti su esamais modeliais ir apėmė 10 kartų daugiau kalbų, ypač palyginti su Šnabždėti. Meta pasiekė perpus mažiau žodžių klaidų, o Massively Multilingual Speech apėmė 11 kartų daugiau kalbų.

„Meta“ teigia, kad nauji kalbos pakeitimo tekstu modeliai nėra tobuli. Pavyzdžiui, jie gali neteisingai išversti žodžius ar frazes, o tai gali sukelti įžeidžiančią ir (arba) neteisingą kalbą, rašė bendrovė. Atsakingas AI technologijų vystymas turi būti įgyvendintas bendradarbiaujant AI bendruomenei.

Kadangi Meta išleido MMS atvirojo kodo tyrimams, ji tikisi, kad tai gali pakeisti kalbos vartojimo nykimo tendenciją. Pagal šią viziją pagalbinės technologijos, TTS ir net virtualiosios realybės bei papildytos realybės technologijos gali leisti kiekvienam kalbėti ir mokytis savo gimtąja kalba. Jame teigiama: „Mes įsivaizduojame pasaulį, kuriame technologijos turi priešingą poveikį, skatinančios žmones išlaikyti savo kalbas gyvas, nes jie gali pasiekti informaciją ir naudotis technologijomis kalbėdami norima kalba.

  • Neseniai Meta paskelbė 2023 m. pirmojo ketvirčio finansinius rezultatus. Nepaisant pastarojo meto restruktūrizavimo pastangų, bendrovė nustebino investuotojus netikėtai išaugusiais pirmojo ketvirčio pardavimais. Trečiadienį akcijos pabrango 12%.

Skaitykite daugiau susijusių straipsnių:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Daugiau straipsnių
Damiras Jalalovas
Damiras Jalalovas

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Institucinis apetitas Bitcoin ETF atžvilgiu auga dėl nepastovumo

13F paraiškų atskleidimas atskleidžia žymius institucinius investuotojus, kurie naudojasi Bitcoin ETF, o tai rodo, kad vis labiau pritariama...

Žinoti daugiau

Ateina nuosprendžio paskelbimo diena: CZ likimas subalansuotas, nes JAV teismas svarsto DOJ prašymą

Changpeng Zhao šiandien laukia nuosprendžio JAV teisme Sietle.

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
Injective sujungia jėgas su AltLayer, kad padidintų inEVM saugumą
Atsakingas verslas Naujienų ataskaita Technologija
Injective sujungia jėgas su AltLayer, kad padidintų inEVM saugumą
Gali 3, 2024
„Masa“ bendradarbiauja su „Teller“, kad pristatytų MASA skolinimo fondą, leidžiantį skolintis USDC pagrindu
rinkos Naujienų ataskaita Technologija
„Masa“ bendradarbiauja su „Teller“, kad pristatytų MASA skolinimo fondą, leidžiantį skolintis USDC pagrindu
Gali 3, 2024
„Velodrome“ ateinančiomis savaitėmis pristato „Superchain“ beta versiją ir išplečiama visose „OP Stack Layer 2 Blockchains“
rinkos Naujienų ataskaita Technologija
„Velodrome“ ateinančiomis savaitėmis pristato „Superchain“ beta versiją ir išplečiama visose „OP Stack Layer 2 Blockchains“
Gali 3, 2024
CARV praneša apie partnerystę su Aethir, kad decentralizuotų savo duomenų sluoksnį ir paskirstytų atlygį
Atsakingas verslas Naujienų ataskaita Technologija
CARV praneša apie partnerystę su Aethir, kad decentralizuotų savo duomenų sluoksnį ir paskirstytų atlygį
Gali 3, 2024
CRYPTOMERIA LABS PTE. LTD.