Uutisraportti Elektroniikka
Voi 23, 2023

Meta on kehittänyt avoimen lähdekoodin puheälyn, joka tunnistaa yli 4,000 puhuttua kieltä

Lyhyesti

Yrityksen MMS-projekti tunnistaa yli 4,000 kieltä.

Kuten useimmat muut julkisesti julkistetut tekoälyprojektinsa, Meta jakaa mallinsa ja koodinsa auttaakseen säilyttämään kielten monimuotoisuuden.

Tällä työllä he toivovat voivansa antaa pienen panoksen maailman uskomattoman kielellisen monimuotoisuuden säilyttämiseen.

Meta on luonut AI-kielimalli, joka on virkistävä käänne ChatGPT. Avoimen lähdekoodin MMS-projekti on luotu säilyttämään kielten monimuotoisuutta ja rohkaisemaan tutkimusta, ja se tunnistaa yli 4,000 1,100 puhuttua kieltä ja tuottaa tekstiä (puhetta) yli XNUMX XNUMX:lla. Yrityksellä on julkisesti julkaistu sen mallit ja koodit tänään edistääkseen tavoitteitaan.

"Jaamme julkisesti luomuksiamme ja koodiamme rohkaistaksemme muita tutkimusyhteisön jäseniä rakentamaan työtämme", Meta kirjoitti. "Tämän pyrkimyksen avulla toivomme säilyttävämme maailman valtavan kielivalikoiman."

Meta on kehittänyt avoimen lähdekoodin puheälyn, joka tunnistaa yli 4,000 puhuttua kieltä

Puheentunnistimien ja tekstistä puheeksi -mallien opettamisen vaikeus suurille äänimäärille ilman transkriptiotarroja on tyypillistä. Tarrat ovat kriittisiä koneoppiminen, joka voi tunnistaa ja luokitella tiedot oikein. Kielten osalta, jotka häviävät tulevina vuosikymmeninä, "tätä dataa ei yksinkertaisesti ole olemassa", kuten Meta selittää.

Meta käytti uskonnollisten tekstien äänitallenteita kerätäkseen tietoa epätavallisella tavalla. "Käytimme uskonnollisten tekstien, kuten Raamatun, käännöksiä, joita on tutkittu laajasti tekstipohjaiseen kielenkäännöstutkimukseen monilla kielillä, koska niitä käännetään monille eri kielille", yhtiö sanoi. Poimimme julkisesti saatavilla olevista käännöksistä äänitallenteita ihmisistä, jotka lukevat näitä tekstejä eri kielillä." Metan tutkijat lisäsivät yli 4,000 kieltä malli.

Lähestymistapa kuulostaa reseptiltä vahvasti puolueelliselle tekoälymallille, joka suosii kristillisiä maailmankatsomuksia. Ennen kuin pilkkaat ideaa, harkitse sitä Metan näkökulmasta: Tutkijat uskovat tämän olevan näin, koska he käyttävät konnektionistista CTC-aikaluokitusta (tai sekvenssistä sekvenssiin tai sekvenssityyppistä mallia), joka on paljon rajoitetumpi. laskentatehoa verrattuna suuria kielimalleja (tunnetaan myös sekvenssityypeinä) tai puheentunnistuksen peräkkäiset mallit. Meta sanoo, että tämä ei johtanut miespuoliseen harhaan useimpien miespuhujien tallentamissa uskonnollisissa äänitteissä.

Meta käytti wav2vec 2.0:aa, "itsevalvottua puheen esityksen oppimismallia" wav2vec 2.0:n kouluttamiseen kohdistusmalli mikä tekee tiedoista käyttökelpoisemman. Itsevalvottu puhemalli, jota Meta itse valvoi merkitsemättömästä datasta, johti loistaviin tuloksiin. Meta havaitsi, että massiivisesti monikieliset puhemallit toimivat hyvin verrattuna olemassa oleviin malleihin ja kattoivat 10 kertaa enemmän kieliä, etenkin verrattuna Kuiskaus. Meta saavutti puolet sanavirheiden määrästä, kun taas Massively Multilingual Speech kattoi 11 kertaa niin monta kieltä.

Meta sanoo, että sen uudet puheesta tekstiksi -mallit eivät ole täydellisiä. He voivat esimerkiksi kääntää sanoja tai lauseita väärin, mikä voi johtaa loukkaavaan ja/tai virheelliseen puheeseen, yhtiö kirjoitti. Tekoälyteknologioiden vastuullinen kehittäminen on saatava aikaan tekoälyyhteisön yhteistyöllä.

Koska Meta on julkaissut MMS:n avoimen lähdekoodin tutkimukseen, se toivoo, että se voi kääntää kielenkäytön katoamissuuntauksen. Tässä visiossa avustava teknologia, TTS ja jopa virtuaalitodellisuus ja lisätyn todellisuuden tekniikka voivat antaa kaikille mahdollisuuden puhua ja oppia omalla äidinkielellään. Siinä todettiin: "Kuvittelemme maailmaa, jossa teknologialla on päinvastainen vaikutus, mikä saa ihmiset pitämään kielensä elossa, koska he voivat saada tietoa ja käyttää teknologiaa puhumalla haluamallaan kielellä."

  • Äskettäin Meta on ilmoittanut vuoden 2023 ensimmäisen vuosineljänneksen taloudellinen tulos. Viimeaikaisista uudelleenjärjestelyistä huolimatta yhtiö yllätti sijoittajat odottamattomalla myynnin kasvulla ensimmäisellä neljänneksellä. Osakkeet nousivat keskiviikkona 12 prosenttia.

Lue lisää aiheeseen liittyviä artikkeleita:

Vastuun kieltäminen

Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.

Author

Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa. 

lisää artikkeleita
Damir Yalalov
Damir Yalalov

Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa. 

Institutionaalinen ruokahalu kasvaa kohti Bitcoin ETF:iä volatiliteetin keskellä

13F-hakemusten kautta tehdyt ilmoitukset paljastavat merkittäviä institutionaalisia sijoittajia, jotka harrastavat Bitcoinin ETF:itä, mikä korostaa kasvavaa hyväksyntää ...

Tiedä enemmän

Tuomiopäivä saapuu: CZ:n kohtalo on tasapainossa, kun Yhdysvaltain tuomioistuin harkitsee DOJ:n vetoomusta

Changpeng Zhao odottaa tänään tuomiota Yhdysvaltain oikeudessa Seattlessa.

Tiedä enemmän
Liity innovatiiviseen teknologiayhteisöömme
Lue lisää
Lue lisää
Injective yhdistää voimansa AltLayerin kanssa tuodakseen Restakingin turvallisuuden inEVM:ään
Bisnes Uutisraportti Elektroniikka
Injective yhdistää voimansa AltLayerin kanssa tuodakseen Restakingin turvallisuuden inEVM:ään
Voi 3, 2024
Masa tekee yhteistyötä Tellerin kanssa ottaakseen käyttöön MASA-lainauspoolin, mikä mahdollistaa USDC-lainauksen pohjalta
markkinat Uutisraportti Elektroniikka
Masa tekee yhteistyötä Tellerin kanssa ottaakseen käyttöön MASA-lainauspoolin, mikä mahdollistaa USDC-lainauksen pohjalta
Voi 3, 2024
Velodrome julkaisee Superchain Beta -version tulevina viikkoina ja laajenee OP Stack Layer 2 -lohkoketjuihin
markkinat Uutisraportti Elektroniikka
Velodrome julkaisee Superchain Beta -version tulevina viikkoina ja laajenee OP Stack Layer 2 -lohkoketjuihin
Voi 3, 2024
CARV ilmoittaa yhteistyöstä Aethirin kanssa tietokerroksen hajauttamiseksi ja palkintojen jakamiseksi
Bisnes Uutisraportti Elektroniikka
CARV ilmoittaa yhteistyöstä Aethirin kanssa tietokerroksen hajauttamiseksi ja palkintojen jakamiseksi
Voi 3, 2024
CRYPTOMERIA LABS PTE. OY.