Notizie Tecnologia
23 Maggio 2023

Meta ha sviluppato un'intelligenza artificiale vocale open source che riconosce oltre 4,000 lingue parlate

In Breve

Il progetto MMS dell'azienda è in grado di riconoscere oltre 4,000 lingue.

Come la maggior parte dei suoi altri progetti di intelligenza artificiale annunciati pubblicamente, Meta condivide i suoi modelli e il codice per aiutare a preservare la diversità linguistica.

Attraverso questo lavoro, sperano di dare un piccolo contributo alla conservazione dell'incredibile diversità linguistica del mondo.

Meta ha creato un modello di linguaggio AI che rappresenta una svolta rinfrescante ChatGPT. L'open source Progetto MM è stato creato per preservare la diversità linguistica e incoraggiare la ricerca e può riconoscere più di 4,000 lingue parlate e produrre testo (discorso) in oltre 1,100. L'azienda ha rilasciato pubblicamente i suoi modelli e codice oggi per promuovere i suoi obiettivi.

"Stiamo condividendo pubblicamente le nostre creazioni e il nostro codice per incoraggiare gli altri nella comunità di ricerca a costruire sul nostro lavoro", ha scritto Meta. "Attraverso questo sforzo, speriamo di preservare l'enorme varietà linguistica del mondo".

Meta ha sviluppato un'intelligenza artificiale vocale open source che riconosce oltre 4,000 lingue parlate

La difficoltà di addestrare riconoscitori vocali e modelli di sintesi vocale su grandi quantità di audio senza etichette di trascrizione è tipica. Le etichette sono fondamentali per machine learning, in grado di identificare e classificare correttamente i dati. Tuttavia, per le lingue che scompariranno nei prossimi decenni, "questi dati semplicemente non esistono", come spiega Meta.

Meta ha utilizzato registrazioni audio di testi religiosi per raccogliere dati in modo non convenzionale. "Abbiamo utilizzato traduzioni di testi religiosi come la Bibbia, che sono stati ampiamente studiati per la ricerca sulla traduzione linguistica basata su testo in molte lingue perché sono tradotti in molte lingue diverse", ha affermato la società. Abbiamo estratto registrazioni audio di persone che leggono questi testi in diverse lingue da traduzioni disponibili al pubblico”. I ricercatori di Meta hanno aggiunto oltre 4,000 lingue al file modello.

L'approccio suona come una ricetta per un modello di intelligenza artificiale fortemente distorto che favorisce le visioni del mondo cristiane. Tuttavia, prima di deridere l'idea, considerala dal punto di vista di Meta: i ricercatori ritengono che sia così perché impiegano una classificazione temporale CTC connessionista (o sequenza-sequenza o modello di tipo sequenza) che è molto più limitata in termini di potenza di calcolo rispetto a modelli linguistici di grandi dimensioni (noti anche come tipi di sequenza) o modelli sequenziali per il riconoscimento vocale. Meta afferma che ciò non ha comportato un pregiudizio maschile nelle registrazioni religiose registrate dalla maggior parte degli oratori maschi.

Meta ha utilizzato wav2vec 2.0, un modello di "apprendimento della rappresentazione vocale auto-supervisionato", per addestrare un wav2vec 2.0 modello di allineamento che rende i dati più utilizzabili. Il modello vocale auto-supervisionato che Meta ha auto-supervisionato da dati non etichettati ha portato a grandi risultati. Meta ha scoperto che i modelli vocali altamente multilingue hanno funzionato bene rispetto ai modelli esistenti e hanno coperto un numero di lingue 10 volte superiore, in particolare rispetto a Sussurro. Meta ha raggiunto la metà del tasso di errore delle parole, mentre Massively Multilingual Speech ha coperto un numero di lingue 11 volte superiore.

Meta afferma che i suoi nuovi modelli di sintesi vocale non sono perfetti. Ad esempio, potrebbero tradurre in modo errato parole o frasi, che potrebbero risultare in discorsi offensivi e/o errati, ha scritto la società. Lo sviluppo responsabile delle tecnologie IA deve essere realizzato attraverso la collaborazione tra la comunità IA.

Poiché Meta ha rilasciato MMS per la ricerca open source, spera di poter invertire la tendenza alla scomparsa dell'uso del linguaggio. In questa visione, la tecnologia assistiva, la sintesi vocale e persino la tecnologia della realtà virtuale e della realtà aumentata potrebbero consentire a tutti di parlare e apprendere nella propria lingua madre. Affermava: "Prevediamo un mondo in cui la tecnologia abbia l'effetto opposto, spingendo le persone a mantenere vive le loro lingue poiché possono accedere alle informazioni e utilizzare la tecnologia parlando nella loro lingua preferita".

  • Di recente Meta ha annunciato risultati finanziari per il primo trimestre del 2023. Nonostante i recenti sforzi di ristrutturazione, la società ha sorpreso gli investitori con un aumento inaspettato delle vendite per il primo trimestre. Le azioni sono aumentate del 12% mercoledì.

Leggi altri articoli correlati:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Altri articoli
Damir Jalalov
Damir Jalalov

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Cresce l’appetito istituzionale verso gli ETF Bitcoin in un contesto di volatilità

Le informazioni fornite tramite la documentazione 13F rivelano importanti investitori istituzionali che si dilettano negli ETF Bitcoin, sottolineando una crescente accettazione di...

Per saperne di più

Arriva il giorno della sentenza: il destino di CZ è in bilico mentre la Corte degli Stati Uniti considera l'appello del Dipartimento di Giustizia

Changpeng Zhao è pronto ad affrontare oggi la sentenza in un tribunale americano a Seattle.

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Injective unisce le forze con AltLayer per portare la sicurezza del ripristino in inEVM
Affari Notizie Tecnologia
Injective unisce le forze con AltLayer per portare la sicurezza del ripristino in inEVM
3 Maggio 2024
Masa collabora con Teller per presentare il pool di prestiti MASA e consentire il prestito su base USDC
Mercati Notizie Tecnologia
Masa collabora con Teller per presentare il pool di prestiti MASA e consentire il prestito su base USDC
3 Maggio 2024
Velodrome lancia la versione beta di Superchain nelle prossime settimane e si espande su blockchain OP Stack Layer 2
Mercati Notizie Tecnologia
Velodrome lancia la versione beta di Superchain nelle prossime settimane e si espande su blockchain OP Stack Layer 2
3 Maggio 2024
CARV annuncia una partnership con Aethir per decentralizzare il proprio livello dati e distribuire premi
Affari Notizie Tecnologia
CARV annuncia una partnership con Aethir per decentralizzare il proprio livello dati e distribuire premi
3 Maggio 2024
LABORATORI DI CRITTOMERIA PTE. srl.