Relatório de notícias Equipar
23 de maio de 2023

A Meta desenvolveu uma IA de fala de código aberto que reconhece mais de 4,000 idiomas falados

Em Breve

O projeto MMS da empresa pode reconhecer mais de 4,000 idiomas.

Como a maioria de seus outros projetos de IA anunciados publicamente, a Meta está compartilhando seus modelos e códigos para ajudar a preservar a diversidade de idiomas.

Através deste trabalho, eles esperam dar uma pequena contribuição para a preservação da incrível diversidade linguística do mundo.

Meta criou um modelo de linguagem de IA que é uma reviravolta refrescante ChatGPT. O código aberto projeto MMS foi criado para preservar a diversidade linguística e incentivar a pesquisa e pode reconhecer mais de 4,000 idiomas falados e produzir texto (fala) em mais de 1,100. a empresa tem lançado publicamente seus modelos e código hoje para promover seus objetivos.

“Estamos compartilhando publicamente nossas criações e códigos para encorajar outras pessoas na comunidade de pesquisa a desenvolver nosso trabalho”, escreveu Meta. “Através desse esforço, esperamos preservar a enorme variedade de idiomas do mundo.”

A Meta desenvolveu uma IA de fala de código aberto que reconhece mais de 4,000 idiomas falados

A dificuldade de treinar reconhecedores de fala e modelos de conversão de texto em fala em grandes quantidades de áudio sem rótulos de transcrição é típica. Os rótulos são essenciais para aprendizado de máquina, que pode identificar e classificar corretamente os dados. No entanto, para idiomas que desaparecerão nas próximas décadas, “esses dados simplesmente não existem”, explica Meta.

A Meta usou gravações de áudio de textos religiosos para coletar dados de maneira não convencional. “Usamos traduções de textos religiosos como a Bíblia, que têm sido amplamente estudados para pesquisa de tradução baseada em texto em muitos idiomas porque são traduzidos em muitos idiomas diferentes”, disse a empresa. Extraímos gravações de áudio de pessoas lendo esses textos em diferentes idiomas de traduções disponíveis publicamente.” Os pesquisadores do Meta adicionaram mais de 4,000 idiomas ao modelo.

A abordagem soa como uma receita para um modelo de IA altamente tendencioso que favorece as cosmovisões cristãs. No entanto, antes de zombar da ideia, considere-a da perspectiva de Meta: os pesquisadores acreditam que seja esse o caso porque empregam uma classificação temporal CTC conexionista (ou modelo sequência a sequência ou tipo sequência) que é muito mais limitada em termos de poder computacional em comparação com grandes modelos de linguagem (também conhecidos como tipos de sequência) ou modelos sequenciais para reconhecimento de fala. Meta diz que isso não resultou em um preconceito masculino nas gravações religiosas gravadas pela maioria dos falantes do sexo masculino.

A Meta usou o wav2vec 2.0, um modelo de “aprendizado de representação de fala auto-supervisionado”, para treinar um wav2vec 2.0 modelo de alinhamento que torna os dados mais utilizáveis. O modelo de fala auto-supervisionado que o Meta auto-supervisionou a partir de dados não rotulados levou a grandes resultados. A Meta descobriu que os modelos de fala massivamente multilíngues tiveram um bom desempenho em comparação com os modelos existentes e cobriram 10 vezes mais idiomas, principalmente em comparação com Sussurro. O Meta alcançou metade da taxa de erro de palavras, enquanto o Massively Multilingual Speech cobriu 11 vezes mais idiomas.

Meta diz que seus novos modelos de fala para texto não são perfeitos. Por exemplo, eles podem traduzir mal palavras ou frases, o que pode resultar em discurso ofensivo e/ou incorreto, escreveu a empresa. O desenvolvimento responsável de tecnologias de IA deve ser realizado por meio da colaboração entre a comunidade de IA.

Como a Meta lançou o MMS para pesquisa de código aberto, ela espera poder reverter a tendência de desaparecimento do uso de idiomas. Nesta visão, tecnologia assistiva, TTS e até mesmo realidade virtual e tecnologia de realidade aumentada podem permitir que todos falem e aprendam em seus idiomas nativos. Ele afirmou: “Vislumbramos um mundo onde a tecnologia tem o efeito oposto, levando as pessoas a manter seus idiomas vivos, pois podem acessar informações e usar a tecnologia falando em seu idioma preferido”.

  • Recentemente, meta anunciou resultados financeiros do primeiro trimestre de 2023. Apesar dos recentes esforços de reestruturação, a empresa surpreendeu os investidores com um aumento inesperado nas vendas do primeiro trimestre. As ações subiram 12% na quarta-feira.

Leia mais artigos relacionados:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Cresce apetite institucional por ETFs de Bitcoin em meio à volatilidade

As divulgações por meio de registros 13F revelam investidores institucionais notáveis ​​​​que se envolvem em ETFs Bitcoin, ressaltando uma aceitação crescente de ...

Saber Mais

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Injective une forças com AltLayer para trazer segurança de restabelecimento para inEVM
O negócio Relatório de notícias Equipar
Injective une forças com AltLayer para trazer segurança de restabelecimento para inEVM
3 de maio de 2024
Masa se une ao Teller para introduzir o pool de empréstimos MASA, permitindo empréstimos em USDC na base
Mercados Relatório de notícias Equipar
Masa se une ao Teller para introduzir o pool de empréstimos MASA, permitindo empréstimos em USDC na base
3 de maio de 2024
Velodrome lança versão beta do Superchain nas próximas semanas e se expande para blockchains OP Stack Layer 2
Mercados Relatório de notícias Equipar
Velodrome lança versão beta do Superchain nas próximas semanas e se expande para blockchains OP Stack Layer 2
3 de maio de 2024
CARV anuncia parceria com Aethir para descentralizar sua camada de dados e distribuir recompensas
O negócio Relatório de notícias Equipar
CARV anuncia parceria com Aethir para descentralizar sua camada de dados e distribuir recompensas
3 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.