Meta ha desenvolupat una IA de parla de codi obert que reconeix més de 4,000 idiomes parlats
En breu
El projecte MMS de l'empresa pot reconèixer més de 4,000 idiomes.
Com la majoria dels seus altres projectes d'IA anunciats públicament, Meta comparteix els seus models i codi per ajudar a preservar la diversitat lingüística.
Amb aquest treball, esperen fer una petita contribució per preservar la increïble diversitat lingüística del món.
meta ha creat un model de llenguatge d'IA que és un gir refrescant ChatGPT. El codi obert Projecte MMS s'ha creat per preservar la diversitat lingüística i fomentar la investigació i pot reconèixer més de 4,000 llengües parlades i produir text (discurs) en més de 1,100. L'empresa té alliberat públicament els seus models i codi avui per afavorir els seus objectius.
"Estem compartint públicament les nostres creacions i el codi per tal d'animar altres persones de la comunitat investigadora a construir el nostre treball", va escriure Meta. "Amb aquest esforç, esperem preservar la gran varietat lingüística del món".
És típica la dificultat d'entrenar reconeixements de veu i models de text a veu en grans quantitats d'àudio sense etiquetes de transcripció. Les etiquetes són fonamentals màquina d'aprenentatge, que pot identificar i classificar correctament les dades. Tanmateix, per als idiomes que desapareixeran en les properes dècades, "aquestes dades simplement no existeixen", tal com explica Meta.
Meta va utilitzar enregistraments d'àudio de textos religiosos per recollir dades d'una manera poc convencional. "Vam utilitzar traduccions de textos religiosos com la Bíblia, que s'han estudiat àmpliament per a la recerca de traducció lingüística basada en text en molts idiomes perquè es tradueixen a molts idiomes diferents", va dir la companyia. Vam extreure enregistraments d'àudio de persones que llegeixen aquests textos en diferents idiomes de traduccions disponibles públicament". Els investigadors de Meta van afegir més de 4,000 idiomes al model.
L'enfocament sembla una recepta per a un model d'IA molt esbiaixat que afavoreix les visions del món cristianes. Tanmateix, abans de burlar-vos de la idea, considereu-la des de la perspectiva de Meta: els investigadors creuen que aquest és el cas perquè utilitzen una classificació temporal CTC conexionista (o un model de seqüència a seqüència o de tipus seqüència) que és molt més limitat en termes. de potència computacional en comparació amb grans models lingüístics (també coneguts com a tipus de seqüència) o models seqüencials per al reconeixement de la parla. Meta diu que això no va donar lloc a un biaix masculí en els enregistraments religiosos gravats per la majoria de parlants masculins.
Meta va utilitzar wav2vec 2.0, un model d'"aprenentatge de representació de la parla autosupervisada", per entrenar un wav2vec 2.0 model d'alineació que fa que les dades siguin més utilitzables. El model de parla autosupervisat que Meta va autosupervisar a partir de dades sense etiquetar va donar grans resultats. Meta va trobar que els models de parla massivament multilingües tenien un bon rendiment en comparació amb els models existents i cobrien 10 vegades més idiomes, especialment en comparació amb Xiuxiueig. Meta va aconseguir la meitat de la taxa d'error de les paraules, mentre que Massively Multilingual Speech va cobrir 11 vegades més idiomes.
Meta diu que els seus nous models de veu a text no són perfectes. Per exemple, poden traduir paraules o frases errònies, cosa que podria provocar un discurs ofensiu i/o incorrecte, va escriure l'empresa. El desenvolupament responsable de les tecnologies d'IA s'ha d'aconseguir mitjançant la col·laboració entre la comunitat d'IA.
Com que Meta ha llançat MMS per a la investigació de codi obert, espera que pugui revertir la tendència a la desaparició de l'ús de la llengua. En aquesta visió, la tecnologia d'assistència, la TTS i fins i tot la realitat virtual i la tecnologia de realitat augmentada poden permetre que tothom parli i aprengui en la seva llengua materna. Va afirmar: "Imaginem un món on la tecnologia té l'efecte contrari, fent que la gent mantingui les seves llengües vives, ja que poden accedir a la informació i utilitzar la tecnologia parlant en la seva llengua preferida".
- Recentment, Meta ha anunciat resultats financers del primer trimestre del 2023. Malgrat els recents esforços de reestructuració, la companyia va sorprendre els inversors amb un augment inesperat de les vendes del primer trimestre. Les accions van augmentar un 12% dimecres.
Llegeix més articles relacionats:
- 4,000 persones es van sotmetre a psicoteràpia robotitzada amb IA sense saber-ho
- Interrupció de la interrupció: com les adreces de la placa de teleport de Stage Meta es faran càrrec del Metavers.
- FTC frena les ambicions de VR de Meta amb una demanda
renúncia
En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.
About The Autor
Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet.
més articlesDamir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet.