Nyhetsrapport Teknologi
Maj 23, 2023

Meta har utvecklat en öppen källkod AI som känner igen över 4,000 XNUMX talade språk

I korthet

Företagets MMS-projekt kan känna igen över 4,000 XNUMX språk.

Liksom de flesta av sina andra offentligt tillkännagivna AI-projekt delar Meta sina modeller och kod för att hjälpa till att bevara språklig mångfald.

Genom detta arbete hoppas de kunna ge ett litet bidrag till att bevara världens otroliga språkliga mångfald.

meta har skapat en AI-språkmodell som är en uppfriskande twist på ChatGPT. Den öppna källkoden MMS-projekt har skapats för att bevara språklig mångfald och uppmuntra forskning och kan känna igen mer än 4,000 1,100 talade språk och producera text (tal) på över XNUMX XNUMX. Företaget har offentligt släppt dess modeller och kod idag för att främja sina mål.

"Vi delar med oss ​​av våra skapelser och vår kod för att uppmuntra andra i forskarsamhället att bygga vidare på vårt arbete", skrev Meta. "Genom denna strävan hoppas vi kunna bevara världens enorma språkvariation."

Meta har utvecklat en öppen källkod AI som känner igen över 4,000 XNUMX talade språk

Svårigheten att träna taligenkännare och text-till-tal-modeller på stora mängder ljud utan transkriptionsetiketter är typisk. Etiketter är avgörande för maskininlärning, som korrekt kan identifiera och klassificera data. Men för språk som kommer att försvinna under de kommande decennierna "finns den här informationen helt enkelt inte", som Meta förklarar.

Meta använde ljudinspelningar av religiösa texter för att samla in data på ett okonventionellt sätt. "Vi använde översättningar av religiösa texter som Bibeln, som har studerats flitigt för textbaserad språköversättningsforskning på många språk eftersom de är översatta till många olika språk", säger företaget. Vi extraherade ljudinspelningar av människor som läser dessa texter på olika språk från allmänt tillgängliga översättningar.” Metas forskare lade till över 4,000 XNUMX språk modell.

Tillvägagångssättet låter som ett recept för en kraftigt partisk AI-modell som gynnar kristna världsbilder. Men innan du hånar idén, överväg det ur Metas perspektiv: Forskare tror att detta är fallet eftersom de använder en konnektionistisk CTC-tidsklassificering (eller sekvens-till-sekvens eller sekvenstypsmodell) som är mycket mer begränsad i termer av beräkningskraft jämfört med stora språkmodeller (även känd som sekvenstyper) eller sekventiella modeller för taligenkänning. Meta säger att detta inte resulterade i en manlig fördom i de religiösa inspelningar som spelades in av de flesta manliga talare.

Meta använde wav2vec 2.0, en "self-supervised speech representation learning"-modell, för att träna en wav2vec 2.0 uppriktningsmodell som gör data mer användbar. Den självövervakade talmodellen som Meta självövervakade från omärkta data ledde till fantastiska resultat. Meta fann att de massivt flerspråkiga talmodellerna fungerade bra jämfört med befintliga modeller och täckte 10 gånger så många språk, särskilt jämfört med Viska. Meta uppnådde hälften av ordfelfrekvensen, medan Massively Multilingual Speech täckte 11 gånger så många språk.

Meta säger att dess nya tal-till-text-modeller inte är perfekta. Till exempel kan de felöversätta ord eller fraser, vilket kan resultera i stötande och/eller felaktigt tal, skrev företaget. Den ansvarsfulla utvecklingen av AI-teknologier måste åstadkommas genom samarbete mellan AI-gemenskapen.

Eftersom Meta har släppt MMS för forskning med öppen källkod hoppas man att det kan vända trenden med att språkanvändningen försvinner. I den här visionen kan hjälpmedel, TTS och till och med virtual reality och augmented reality-teknik tillåta alla att prata och lära sig på sina modersmål. Det stod, "Vi föreställer oss en värld där teknik har motsatt effekt, vilket får människor att hålla sina språk vid liv eftersom de kan få tillgång till information och använda teknik genom att tala på sitt föredragna språk."

  • Nyligen, Meta har meddelat finansiella resultat för första kvartalet 2023. Trots de senaste omstruktureringsinsatserna överraskade företaget investerarna med en oväntad försäljningsökning för första kvartalet. Aktien steg med 12 procent på onsdagen.

Läs fler relaterade artiklar:

Villkor

I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.

Om författaren

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

fler artiklar
Damir Yalalov
Damir Yalalov

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

Institutionell aptit växer mot Bitcoin ETFs mitt i volatilitet

Avslöjande genom 13F-anmälningar avslöjar anmärkningsvärda institutionella investerare som sysslar med Bitcoin ETF:er, vilket understryker en växande acceptans av ...

Lär dig mer

Straffdagen anländer: CZ:s öde hänger i balans när den amerikanska domstolen överväger DOJ:s vädjande

Changpeng Zhao är redo att dömas i en amerikansk domstol i Seattle i dag.

Lär dig mer
Gå med i vår innovativa teknikgemenskap
Läs mer
Läs mer
Injective går samman med AltLayer för att ge inEVM återupptagande säkerhet
Företag Nyhetsrapport Teknologi
Injective går samman med AltLayer för att ge inEVM återupptagande säkerhet
Maj 3, 2024
Masa samarbetar med Teller för att introducera MASA Lending Pool, möjliggör USDC-lån på basen
Marknader Nyhetsrapport Teknologi
Masa samarbetar med Teller för att introducera MASA Lending Pool, möjliggör USDC-lån på basen
Maj 3, 2024
Velodrome lanserar Superchain Beta-version under de kommande veckorna och expanderar över OP Stack Layer 2 Blockchains
Marknader Nyhetsrapport Teknologi
Velodrome lanserar Superchain Beta-version under de kommande veckorna och expanderar över OP Stack Layer 2 Blockchains
Maj 3, 2024
CARV tillkännager partnerskap med Aethir för att decentralisera sitt datalager och dela ut belöningar
Företag Nyhetsrapport Teknologi
CARV tillkännager partnerskap med Aethir för att decentralisera sitt datalager och dela ut belöningar
Maj 3, 2024