Võib 23 2023

Meta on välja töötanud avatud lähtekoodiga kõne AI, mis tunneb ära üle 4,000 räägitava keele

by Damir Jalalov

Avaldatud: 23. mai 2023 kell 6:00 Värskendatud: 23. mai 2023 kell 5:12

by Karolina Gaszcz

Muudetud ja faktide alusel kontrollitud: 23. mai 2023 kell 6:00

Põgusalt

Ettevõtte MMS-projekt suudab ära tunda üle 4,000 keele.

Nagu enamik teisi avalikult välja kuulutatud AI-projekte, jagab Meta oma mudeleid ja koodi, et aidata säilitada keelelist mitmekesisust.

Selle tööga loodavad nad anda väikese panuse maailma uskumatu keelelise mitmekesisuse säilitamisse.

Meta on loonud AI keelemudel, mis on värskendav ChatGPT. Avatud lähtekoodiga MMS projekt on loodud keelelise mitmekesisuse säilitamiseks ja uurimistöö julgustamiseks ning suudab ära tunda rohkem kui 4,000 kõnekeelt ja toota teksti (kõnet) enam kui 1,100 keeles. Ettevõttel on avalikult vabastatud selle mudelid ja kood juba täna, et saavutada oma eesmärke.

"Jagame avalikult oma loomingut ja koodi, et julgustada teisi teadlaskonnas meie tööd edasi kasutama," kirjutas Meta. "Selle ettevõtmisega loodame säilitada maailma tohutu keelekeele mitmekesisuse."

Meta on välja töötanud avatud lähtekoodiga kõne AI, mis tunneb ära üle 4,000 räägitava keele

Tüüpiline on kõnetuvastajate ja teksti kõneks muutmise mudelite treenimine suurel hulgal helil ilma transkriptsioonisiltideta. Sildid on kriitilise tähtsusega masinõpe, mis suudab andmeid õigesti tuvastada ja klassifitseerida. Kuid järgmistel aastakümnetel kaovate keelte puhul "neid andmeid lihtsalt pole," selgitab Meta.

Meta kasutas religioossete tekstide helisalvestisi andmete kogumiseks ebatavalisel viisil. "Kasutasime religioossete tekstide, näiteks Piibli tõlkeid, mida on paljudes keeltes tekstipõhiste keeletõlkeuuringute jaoks laialdaselt uuritud, kuna neid tõlgitakse paljudesse erinevatesse keeltesse," teatas ettevõte. Me eraldasime avalikult kättesaadavatest tõlgetest helisalvestised inimestest, kes loevad neid tekste erinevates keeltes. Meta teadlased lisasid sellele üle 4,000 keele mudel.

See lähenemine kõlab retseptina tugevalt kallutatud tehisintellekti mudelile, mis soosib kristlikke maailmavaateid. Kuid enne, kui selle idee üle irvitate, kaaluge seda Meta vaatenurgast: teadlased usuvad, et see nii on, kuna nad kasutavad konneksionistlikku CTC ajalist klassifikatsiooni (või järjestus-järjestus või järjestustüüpi mudelit), mis on palju piiratum. arvutusvõimsusest võrreldes suured keelemudelid (tuntud ka kui jadatüübid) või kõnetuvastuse järjestikused mudelid. Meta ütleb, et see ei põhjustanud enamiku meessoost kõnelejate salvestatud religioossete salvestiste puhul meeste kallutatust.

Meta kasutas wav2vec 2.0 treenimiseks mudelit wav2vec 2.0, "enesevalvega kõneesitusõppe" mudelit. joondusmudel mis muudab andmed paremini kasutatavaks. Enesejärelevalvega kõnemudel, mida Meta ise jälgis märgistamata andmete põhjal, andis suurepäraseid tulemusi. Meta leidis, et massiliselt mitmekeelsed kõnemudelid toimisid hästi võrreldes olemasolevate mudelitega ja hõlmasid 10 korda rohkem keeli, eriti võrreldes Sosin. Meta saavutas poole väiksema sõnade veamäära, samas kui massiliselt mitmekeelne kõne hõlmas 11 korda rohkem keeli.

Meta ütleb, et selle uued kõnest tekstiks muutmise mudelid pole täiuslikud. Näiteks võivad nad sõnu või fraase valesti tõlkida, mis võib põhjustada solvavat ja/või ebakorrektset kõnet, kirjutas ettevõte. Tehisintellekti tehnoloogiate vastutustundlik arendamine peab toimuma tehisintellekti kogukonna vahelise koostöö kaudu.

Kuna Meta on avatud lähtekoodiga uurimistöö jaoks välja andnud MMS-i, loodab ta, et see võib keelekasutuse kadumise trendi ümber pöörata. Selles nägemuses võivad abitehnoloogia, TTS ja isegi virtuaalreaalsuse ja liitreaalsuse tehnoloogia võimaldada kõigil rääkida ja õppida oma emakeeles. Selles öeldakse: "Me kujutame ette maailma, kus tehnoloogial on vastupidine mõju, ajendades inimesi hoidma oma keeli elus, kuna nad pääsevad teabele ja kasutavad tehnoloogiat, rääkides oma eelistatud keeles."

Hiljuti Meta teatas 2023. aasta esimese kvartali majandustulemused. Vaatamata hiljutistele ümberstruktureerimispüüdlustele üllatas ettevõte investoreid esimese kvartali ootamatu müügikasvuga. Aktsiad tõusid kolmapäeval 12%.

Loe rohkem seotud artikleid:

Sildid:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks.

Veel artikleid

Damir Jalalov