Informe de notícies Tecnologia
Pot 23, 2023

Meta ha desenvolupat una IA de parla de codi obert que reconeix més de 4,000 idiomes parlats

En breu

El projecte MMS de l'empresa pot reconèixer més de 4,000 idiomes.

Com la majoria dels seus altres projectes d'IA anunciats públicament, Meta comparteix els seus models i codi per ajudar a preservar la diversitat lingüística.

Amb aquest treball, esperen fer una petita contribució per preservar la increïble diversitat lingüística del món.

meta ha creat un model de llenguatge d'IA que és un gir refrescant ChatGPT. El codi obert Projecte MMS s'ha creat per preservar la diversitat lingüística i fomentar la investigació i pot reconèixer més de 4,000 llengües parlades i produir text (discurs) en més de 1,100. L'empresa té alliberat públicament els seus models i codi avui per afavorir els seus objectius.

"Estem compartint públicament les nostres creacions i el codi per tal d'animar altres persones de la comunitat investigadora a construir el nostre treball", va escriure Meta. "Amb aquest esforç, esperem preservar la gran varietat lingüística del món".

Meta ha desenvolupat una IA de parla de codi obert que reconeix més de 4,000 idiomes parlats

És típica la dificultat d'entrenar reconeixements de veu i models de text a veu en grans quantitats d'àudio sense etiquetes de transcripció. Les etiquetes són fonamentals màquina d'aprenentatge, que pot identificar i classificar correctament les dades. Tanmateix, per als idiomes que desapareixeran en les properes dècades, "aquestes dades simplement no existeixen", tal com explica Meta.

Meta va utilitzar enregistraments d'àudio de textos religiosos per recollir dades d'una manera poc convencional. "Vam utilitzar traduccions de textos religiosos com la Bíblia, que s'han estudiat àmpliament per a la recerca de traducció lingüística basada en text en molts idiomes perquè es tradueixen a molts idiomes diferents", va dir la companyia. Vam extreure enregistraments d'àudio de persones que llegeixen aquests textos en diferents idiomes de traduccions disponibles públicament". Els investigadors de Meta van afegir més de 4,000 idiomes al model.

L'enfocament sembla una recepta per a un model d'IA molt esbiaixat que afavoreix les visions del món cristianes. Tanmateix, abans de burlar-vos de la idea, considereu-la des de la perspectiva de Meta: els investigadors creuen que aquest és el cas perquè utilitzen una classificació temporal CTC conexionista (o un model de seqüència a seqüència o de tipus seqüència) que és molt més limitat en termes. de potència computacional en comparació amb grans models lingüístics (també coneguts com a tipus de seqüència) o models seqüencials per al reconeixement de la parla. Meta diu que això no va donar lloc a un biaix masculí en els enregistraments religiosos gravats per la majoria de parlants masculins.

Meta va utilitzar wav2vec 2.0, un model d'"aprenentatge de representació de la parla autosupervisada", per entrenar un wav2vec 2.0 model d'alineació que fa que les dades siguin més utilitzables. El model de parla autosupervisat que Meta va autosupervisar a partir de dades sense etiquetar va donar grans resultats. Meta va trobar que els models de parla massivament multilingües tenien un bon rendiment en comparació amb els models existents i cobrien 10 vegades més idiomes, especialment en comparació amb Xiuxiueig. Meta va aconseguir la meitat de la taxa d'error de les paraules, mentre que Massively Multilingual Speech va cobrir 11 vegades més idiomes.

Meta diu que els seus nous models de veu a text no són perfectes. Per exemple, poden traduir paraules o frases errònies, cosa que podria provocar un discurs ofensiu i/o incorrecte, va escriure l'empresa. El desenvolupament responsable de les tecnologies d'IA s'ha d'aconseguir mitjançant la col·laboració entre la comunitat d'IA.

Com que Meta ha llançat MMS per a la investigació de codi obert, espera que pugui revertir la tendència a la desaparició de l'ús de la llengua. En aquesta visió, la tecnologia d'assistència, la TTS i fins i tot la realitat virtual i la tecnologia de realitat augmentada poden permetre que tothom parli i aprengui en la seva llengua materna. Va afirmar: "Imaginem un món on la tecnologia té l'efecte contrari, fent que la gent mantingui les seves llengües vives, ja que poden accedir a la informació i utilitzar la tecnologia parlant en la seva llengua preferida".

  • Recentment, Meta ha anunciat resultats financers del primer trimestre del 2023. Malgrat els recents esforços de reestructuració, la companyia va sorprendre els inversors amb un augment inesperat de les vendes del primer trimestre. Les accions van augmentar un 12% dimecres.

Llegeix més articles relacionats:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

més articles
Damir Yalalov
Damir Yalalov

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

L'apetit institucional creix cap als ETF de Bitcoin enmig de la volatilitat

Les divulgacions a través de les presentacions 13F revelen inversors institucionals notables que s'estan incursionant en els ETF de Bitcoin, subratllant una acceptació creixent de...

saber Més

Arriba el dia de la sentència: el destí de CZ està en equilibri mentre el tribunal nord-americà considera la petició del DOJ

Changpeng Zhao està a punt d'enfrontar-se avui a la sentència en un tribunal dels Estats Units a Seattle.

saber Més
Uneix-te a la nostra comunitat tecnològica innovadora
Més...
Llegeix més
Injective uneix forces amb AltLayer per aportar seguretat de restauració a inEVM
Negocis Informe de notícies Tecnologia
Injective uneix forces amb AltLayer per aportar seguretat de restauració a inEVM
Pot 3, 2024
Masa s'uneix amb Teller per presentar el grup de préstecs MASA, que permet l'endeutament de l'USDC a la base
mercats Informe de notícies Tecnologia
Masa s'uneix amb Teller per presentar el grup de préstecs MASA, que permet l'endeutament de l'USDC a la base
Pot 3, 2024
Velodrome llança la versió beta de Superchain en les properes setmanes i s'expandeix a les cadenes de blocs de la capa 2 de la pila OP
mercats Informe de notícies Tecnologia
Velodrome llança la versió beta de Superchain en les properes setmanes i s'expandeix a les cadenes de blocs de la capa 2 de la pila OP
Pot 3, 2024
CARV anuncia associació amb Aethir per descentralitzar la seva capa de dades i distribuir recompenses
Negocis Informe de notícies Tecnologia
CARV anuncia associació amb Aethir per descentralitzar la seva capa de dades i distribuir recompenses
Pot 3, 2024
CRYPTOMERIA LABS PTE. LTD.