Nieuwsverslag Technologie
23 mei 2023

Meta heeft een open-source spraak-AI ontwikkeld die meer dan 4,000 gesproken talen herkent

In het kort

Het MMS-project van het bedrijf kan meer dan 4,000 talen herkennen.

Net als de meeste van zijn andere openbaar aangekondigde AI-projecten, deelt Meta zijn modellen en code om de taaldiversiteit te helpen behouden.

Door dit werk hopen ze een kleine bijdrage te leveren aan het behoud van de ongelooflijke taaldiversiteit van de wereld.

meta heeft gemaakt een AI-taalmodel met een verfrissende draai ChatGPT. De open source MMS-project is gemaakt om taaldiversiteit te behouden en onderzoek aan te moedigen en kan meer dan 4,000 gesproken talen herkennen en tekst (spraak) produceren in meer dan 1,100. Het bedrijf heeft publiekelijk vrijgegeven zijn modellen en code vandaag om zijn doelen te bereiken.

"We delen onze creaties en code publiekelijk om anderen in de onderzoeksgemeenschap aan te moedigen voort te bouwen op ons werk", schreef Meta. "Door dit streven hopen we de enorme taalverscheidenheid van de wereld te behouden."

Meta heeft een open-source spraak-AI ontwikkeld die meer dan 4,000 gesproken talen herkent

Typisch is de moeilijkheid om spraakherkenners en tekst-naar-spraak-modellen te trainen op grote hoeveelheden audio zonder transcriptielabels. Etiketten zijn cruciaal voor machine learning, die gegevens correct kan identificeren en classificeren. Maar voor talen die de komende decennia zullen verdwijnen, "bestaan ​​deze gegevens gewoon niet", legt Meta uit.

Meta gebruikte audio-opnamen van religieuze teksten om op een onconventionele manier gegevens te verzamelen. "We gebruikten vertalingen van religieuze teksten zoals de Bijbel, die in veel talen uitgebreid zijn bestudeerd voor tekstgebaseerd taalvertaalonderzoek, omdat ze in veel verschillende talen zijn vertaald", aldus het bedrijf. We haalden audio-opnamen van mensen die deze teksten in verschillende talen lazen uit openbaar beschikbare vertalingen.” Meta's onderzoekers voegden meer dan 4,000 talen toe aan de model.

De aanpak klinkt als een recept voor een sterk bevooroordeeld AI-model dat de voorkeur geeft aan christelijke wereldbeelden. Voordat u echter spot met het idee, moet u het vanuit Meta's perspectief bekijken: onderzoekers geloven dat dit het geval is omdat ze een connectionistische CTC-tijdelijke classificatie (of sequentie-naar-sequentie- of sequentie-type model) gebruiken die veel beperkter is in termen rekenkracht vergeleken met grote taalmodellen (ook wel sequentietypes genoemd) of sequentiële modellen voor spraakherkenning. Meta zegt dat dit niet resulteerde in een mannelijke vooringenomenheid in de religieuze opnames die door de meeste mannelijke sprekers werden opgenomen.

Meta gebruikte wav2vec 2.0, een model voor het leren van spraakrepresentatie onder toezicht, om een ​​wav2vec 2.0 te trainen uitlijningsmodel dat maakt data bruikbaarder. Het zelfgestuurde spraakmodel dat Meta zelfbeheerde op basis van niet-gelabelde gegevens, leidde tot geweldige resultaten. Meta ontdekte dat de massaal meertalige spraakmodellen goed presteerden in vergelijking met bestaande modellen en 10 keer zoveel talen dekten, vooral in vergelijking met Fluisteren. Meta behaalde de helft van het woordfoutpercentage, terwijl Massively Multilingual Speech 11 keer zoveel talen omvatte.

Meta zegt dat zijn nieuwe spraak-naar-tekst-modellen niet perfect zijn. Ze kunnen bijvoorbeeld woorden of zinsdelen verkeerd vertalen, wat kan leiden tot aanstootgevende en/of onjuiste spraak, schreef het bedrijf. De verantwoorde ontwikkeling van AI-technologieën moet worden bereikt door samenwerking tussen de AI-gemeenschap.

Aangezien Meta MMS heeft uitgebracht voor open-sourceonderzoek, hoopt het de trend van het verdwijnen van taalgebruik te kunnen keren. In deze visie kunnen ondersteunende technologie, TTS en zelfs virtual reality en augmented reality-technologie iedereen in staat stellen om in hun moedertaal te spreken en te leren. Het verklaarde: "We stellen ons een wereld voor waarin technologie het tegenovergestelde effect heeft, mensen ertoe aanzet hun taal levend te houden, aangezien ze toegang hebben tot informatie en technologie kunnen gebruiken door in hun voorkeurstaal te spreken."

  • Onlangs, Meta heeft aangekondigd financiële resultaten voor het eerste kwartaal van 2023. Ondanks recente herstructureringsinspanningen verraste het bedrijf investeerders met een onverwachte omzetstijging voor het eerste kwartaal. De aandelen stegen woensdag met 12%.

Lees meer gerelateerde artikelen:

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Meer artikelen
Damir Jalalov
Damir Jalalov

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

De institutionele belangstelling groeit richting Bitcoin ETF’s te midden van volatiliteit

Uit openbaarmakingen via 13F-registraties blijkt dat opmerkelijke institutionele beleggers zich bezighouden met Bitcoin ETF's, wat een groeiende acceptatie onderstreept van ...

Meer weten

De dag van de veroordeling breekt aan: het lot van CZ hangt in evenwicht terwijl de Amerikaanse rechtbank het pleidooi van DOJ in overweging neemt

Changpeng Zhao staat vandaag op het punt te worden veroordeeld door een Amerikaanse rechtbank in Seattle.

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Injective bundelt krachten met AltLayer om de beveiliging van inEVM te herstellen
Business Nieuwsverslag Technologie
Injective bundelt krachten met AltLayer om de beveiliging van inEVM te herstellen
3 mei 2024
Masa werkt samen met Teller om MASA Lending Pool te introduceren, waardoor USDC-leningen op de basis mogelijk worden
Markten Nieuwsverslag Technologie
Masa werkt samen met Teller om MASA Lending Pool te introduceren, waardoor USDC-leningen op de basis mogelijk worden
3 mei 2024
Velodrome lanceert de komende weken de bètaversie van Superchain en breidt zich uit over OP Stack Layer 2 Blockchains
Markten Nieuwsverslag Technologie
Velodrome lanceert de komende weken de bètaversie van Superchain en breidt zich uit over OP Stack Layer 2 Blockchains
3 mei 2024
CARV kondigt partnerschap aan met Aethir om zijn datalaag te decentraliseren en beloningen te verdelen
Business Nieuwsverslag Technologie
CARV kondigt partnerschap aan met Aethir om zijn datalaag te decentraliseren en beloningen te verdelen
3 mei 2024