„Meta“ sukūrė atvirojo kodo kalbos AI, atpažįstančią daugiau nei 4,000 šnekamų kalbų
Trumpai
Įmonės MMS projektas gali atpažinti daugiau nei 4,000 kalbų.
Kaip ir dauguma kitų viešai paskelbtų AI projektų, „Meta“ dalijasi savo modeliais ir kodu, kad padėtų išsaugoti kalbų įvairovę.
Šiuo darbu jie tikisi šiek tiek prisidėti prie neįtikėtinos pasaulio kalbų įvairovės išsaugojimo.
meta sukūrė AI kalbos modelis, kuris yra gaivus posūkis ChatGPT. Atvirojo kodo MMS projektas buvo sukurtas siekiant išsaugoti kalbų įvairovę ir skatinti mokslinius tyrimus ir gali atpažinti daugiau nei 4,000 1,100 šnekamų kalbų ir sukurti tekstą (kalbą) daugiau nei XNUMX XNUMX kalbų. Įmonė turi viešai išleistas savo modelius ir kodą šiandien, kad pasiektų savo tikslus.
„Mes viešai dalijamės savo kūriniais ir kodu, kad paskatintume kitus mokslo bendruomenės narius remtis mūsų darbu“, – rašė Meta. „Šiomis pastangomis tikimės išsaugoti didžiulę pasaulio kalbų įvairovę.
Būdingi sunkumai mokant kalbos atpažinimo įrenginius ir teksto į kalbą modelius dideliems garso kiekiams be transkripcijos etikečių. Etiketės yra labai svarbios mašininis mokymasis, kuris gali teisingai identifikuoti ir klasifikuoti duomenis. Tačiau kalboms, kurios išnyks per ateinančius dešimtmečius, „šių duomenų tiesiog nėra“, kaip aiškina Meta.
Meta naudojo religinių tekstų garso įrašus, kad rinktų duomenis netradiciniu būdu. „Naudojome religinių tekstų, pvz., Biblijos, vertimus, kurie buvo plačiai ištirti atliekant teksto kalbos vertimo tyrimus daugeliu kalbų, nes jie verčiami į daugybę skirtingų kalbų“, – teigė bendrovė. Iš viešai prieinamų vertimų ištraukėme garso įrašus, kuriuose žmonės skaito šiuos tekstus įvairiomis kalbomis. „Meta“ tyrėjai prie jo pridėjo daugiau nei 4,000 kalbų modelis.
Šis požiūris skamba kaip labai šališko AI modelio, kuris palankiai vertina krikščionišką pasaulėžiūrą, receptas. Tačiau prieš šaipydamiesi iš šios idėjos, apsvarstykite ją Metos požiūriu: mokslininkai mano, kad taip yra, nes jie naudoja konnekcionistinį CTC laiko klasifikavimą (arba sekos į seką arba sekos tipo modelį), kuris yra daug labiau ribotas. skaičiavimo galios, palyginti su didelių kalbų modeliai (taip pat žinomi kaip sekos tipai) arba nuoseklūs kalbos atpažinimo modeliai. Meta teigia, kad dėl to daugumos vyrų kalbėtojų įrašytuose religiniuose įrašuose nebuvo vyrų šališkumo.
Meta naudojo wav2vec 2.0, „savarankiškai prižiūrimą kalbos vaizdavimo mokymosi“ modelį, kad apmokytų wav2vec 2.0 derinimo modelis todėl duomenys tampa naudingesni. Savarankiškai prižiūrimas kalbos modelis, kurį Meta savarankiškai prižiūrėjo iš nepažymėtų duomenų, davė puikių rezultatų. Meta nustatė, kad masiniai daugiakalbių kalbų modeliai veikė gerai, palyginti su esamais modeliais ir apėmė 10 kartų daugiau kalbų, ypač palyginti su Šnabždėti. Meta pasiekė perpus mažiau žodžių klaidų, o Massively Multilingual Speech apėmė 11 kartų daugiau kalbų.
„Meta“ teigia, kad nauji kalbos pakeitimo tekstu modeliai nėra tobuli. Pavyzdžiui, jie gali neteisingai išversti žodžius ar frazes, o tai gali sukelti įžeidžiančią ir (arba) neteisingą kalbą, rašė bendrovė. Atsakingas AI technologijų vystymas turi būti įgyvendintas bendradarbiaujant AI bendruomenei.
Kadangi Meta išleido MMS atvirojo kodo tyrimams, ji tikisi, kad tai gali pakeisti kalbos vartojimo nykimo tendenciją. Pagal šią viziją pagalbinės technologijos, TTS ir net virtualiosios realybės bei papildytos realybės technologijos gali leisti kiekvienam kalbėti ir mokytis savo gimtąja kalba. Jame teigiama: „Mes įsivaizduojame pasaulį, kuriame technologijos turi priešingą poveikį, skatinančios žmones išlaikyti savo kalbas gyvas, nes jie gali pasiekti informaciją ir naudotis technologijomis kalbėdami norima kalba.
- Neseniai Meta paskelbė 2023 m. pirmojo ketvirčio finansinius rezultatus. Nepaisant pastarojo meto restruktūrizavimo pastangų, bendrovė nustebino investuotojus netikėtai išaugusiais pirmojo ketvirčio pardavimais. Trečiadienį akcijos pabrango 12%.
Skaitykite daugiau susijusių straipsnių:
- 4,000 žmonių buvo taikytas AI robotų psichoterapija to nežinodami
- Trikdžių trikdymas: kaip „Stage Meta“ teleporto plokštelės adresai perims Metaverse.
- FTC suvaržo „Meta“ VR ambicijas pateikdama ieškinį
Atsakomybės neigimas
Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.
Apie autorių
Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže.
Daugiau straipsniųDamiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže.