Nyheds rapport Teknologier
Maj 23, 2023

Meta har udviklet en Open-Source-tale AI, der genkender over 4,000 talte sprog

Kort sagt

Virksomhedens MMS-projekt kan genkende over 4,000 sprog.

Som de fleste af sine andre offentligt annoncerede AI-projekter deler Meta sine modeller og kode for at hjælpe med at bevare sproglig mangfoldighed.

Gennem dette arbejde håber de at kunne yde et lille bidrag til at bevare den utrolige sproglige mangfoldighed i verden.

Meta har oprettet en AI-sprogmodel, der er et forfriskende twist på ChatGPT. Den åbne kildekode MMS projekt er skabt for at bevare sproglig mangfoldighed og tilskynde til forskning og kan genkende mere end 4,000 talte sprog og producere tekst (tale) i over 1,100. Virksomheden har offentligt udgivet sine modeller og kode i dag for at fremme sine mål.

"Vi deler offentligt vores kreationer og kode for at opmuntre andre i forskningssamfundet til at bygge videre på vores arbejde," skrev Meta. "Gennem denne bestræbelse håber vi at bevare den enorme sprogvariation i verden."

Meta har udviklet en Open-Source-tale AI, der genkender over 4,000 talte sprog

Vanskeligheden ved at træne talegenkendere og tekst-til-tale-modeller på store mængder lyd uden transskriptionsetiketter er typisk. Etiketter er afgørende for machine learning, som korrekt kan identificere og klassificere data. Men for sprog, der vil forsvinde i de kommende årtier, "eksisterer disse data simpelthen ikke," som Meta forklarer.

Meta brugte lydoptagelser af religiøse tekster til at indsamle data på en utraditionel måde. "Vi brugte oversættelser af religiøse tekster såsom Bibelen, som er blevet bredt undersøgt til tekstbaseret sprogoversættelsesforskning på mange sprog, fordi de er oversat til mange forskellige sprog," sagde virksomheden. Vi udtog lydoptagelser af folk, der læste disse tekster på forskellige sprog, fra offentligt tilgængelige oversættelser." Metas forskere føjede over 4,000 sprog til model.

Tilgangen lyder som en opskrift på en stærkt forudindtaget AI-model, der favoriserer kristne verdenssyn. Men før du spotter ideen, så overvej det fra Metas perspektiv: Forskere mener, at dette er tilfældet, fordi de anvender en forbindelseistisk CTC tidsmæssig klassifikation (eller sekvens-til-sekvens eller sekvens-type model), der er meget mere begrænset i termer. af regnekraft sammenlignet med store sprogmodeller (også kendt som sekvenstyper) eller sekventielle modeller til talegenkendelse. Meta siger, at dette ikke resulterede i en mandlig skævhed i de religiøse optagelser optaget af de fleste mandlige talere.

Meta brugte wav2vec 2.0, en model for "selvovervåget talerepræsentation", til at træne en wav2vec 2.0 alignment model der gør data mere anvendelige. Den selv-overvågede talemodel, som Meta selv-overvågede fra umærkede data, førte til store resultater. Meta fandt ud af, at de massivt flersprogede talemodeller klarede sig godt sammenlignet med eksisterende modeller og dækkede 10 gange så mange sprog, især sammenlignet med Hviske. Meta opnåede halvdelen af ​​ordfejlfrekvensen, mens Massively Multilingual Speech dækkede 11 gange så mange sprog.

Meta siger, at dens nye tale-til-tekst-modeller ikke er perfekte. For eksempel kan de fejloversætte ord eller sætninger, hvilket kan resultere i stødende og/eller forkert tale, skrev virksomheden. Den ansvarlige udvikling af AI-teknologier skal opnås gennem samarbejde mellem AI-samfundet.

Da Meta har udgivet MMS til open source-forskning, håber det, at det kan vende tendensen til, at sprogbrug forsvinder. I denne vision kan hjælpeteknologi, TTS og endda virtual reality og augmented reality-teknologi give alle mulighed for at tale og lære på deres modersmål. Den sagde: "Vi forestiller os en verden, hvor teknologi har den modsatte effekt, hvilket får folk til at holde deres sprog i live, da de kan få adgang til information og bruge teknologi ved at tale på deres foretrukne sprog."

  • For nylig, Meta har annonceret finansielle resultater for første kvartal af 2023. På trods af de seneste omstruktureringsbestræbelser overraskede virksomheden investorerne med en uventet stigning i salget for første kvartal. Aktien steg 12 pct. onsdag.

Læs flere relaterede artikler:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Hot Stories
Tilmeld dig vores nyhedsbrev.
Seneste Nyheder

Institutionel appetit vokser mod Bitcoin ETF'er midt i volatilitet

Afsløringer gennem 13F-arkivering afslører bemærkelsesværdige institutionelle investorer, der dytter i Bitcoin ETF'er, hvilket understreger en voksende accept af ...

Vide mere

Straffeudmålingsdagen ankommer: CZ's skæbne hænger i balance, da amerikansk domstol overvejer DOJ's anbringende

Changpeng Zhao står klar til at blive dømt ved en amerikansk domstol i Seattle i dag.

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
Injective slår sig sammen med AltLayer for at give inEVM genskabende sikkerhed
Forretning Nyheds rapport Teknologier
Injective slår sig sammen med AltLayer for at give inEVM genskabende sikkerhed
Maj 3, 2024
Masa går sammen med Teller for at introducere MASA Lending Pool, muliggør USDC-lån på base
Markeder Nyheds rapport Teknologier
Masa går sammen med Teller for at introducere MASA Lending Pool, muliggør USDC-lån på base
Maj 3, 2024
Velodrome lancerer Superchain Beta-version i de kommende uger og udvider på tværs af OP Stack Layer 2 Blockchains
Markeder Nyheds rapport Teknologier
Velodrome lancerer Superchain Beta-version i de kommende uger og udvider på tværs af OP Stack Layer 2 Blockchains
Maj 3, 2024
CARV annoncerer partnerskab med Aethir for at decentralisere sit datalag og uddele belønninger
Forretning Nyheds rapport Teknologier
CARV annoncerer partnerskab med Aethir for at decentralisere sit datalag og uddele belønninger
Maj 3, 2024