Raport aktualności Technologia
23 maja 2023 r.

Meta opracowała sztuczną inteligencję mowy typu open source, która rozpoznaje ponad 4,000 języków mówionych

W skrócie

Firmowy projekt MMS rozpoznaje ponad 4,000 języków.

Podobnie jak większość innych publicznie ogłoszonych projektów AI, Meta udostępnia swoje modele i kod, aby pomóc zachować różnorodność językową.

Dzięki tej pracy mają nadzieję wnieść niewielki wkład w zachowanie niesamowitej różnorodności językowej świata.

Meta stworzył model języka AI, który jest odświeżającym akcentem ChatGPT. Otwarte źródło Projekt MMS został stworzony w celu zachowania różnorodności językowej i zachęcania do badań i może rozpoznawać ponad 4,000 języków mówionych oraz tworzyć tekst (mowę) w ponad 1,100. Firma ma publicznie wydany swoje modele i kod dzisiaj, aby realizować swoje cele.

„Publicznie udostępniamy nasze dzieła i kod, aby zachęcić innych członków społeczności badawczej do korzystania z naszej pracy” — napisał Meta. „Dzięki temu przedsięwzięciu mamy nadzieję zachować ogromną różnorodność językową świata”.

Meta opracowała sztuczną inteligencję mowy typu open source, która rozpoznaje ponad 4,000 języków mówionych

Trudność w szkoleniu aparatów rozpoznawania mowy i modeli zamiany tekstu na mowę na dużych ilościach dźwięku bez etykiet transkrypcji jest typowa. Etykiety mają kluczowe znaczenie uczenie maszynowe, który może poprawnie identyfikować i klasyfikować dane. Jednak w przypadku języków, które znikną w nadchodzących dziesięcioleciach, „te dane po prostu nie istnieją”, jak wyjaśnia Meta.

Meta wykorzystywała nagrania audio tekstów religijnych do zbierania danych w niekonwencjonalny sposób. „Użyliśmy tłumaczeń tekstów religijnych, takich jak Biblia, które były szeroko badane w badaniach tłumaczeń tekstowych w wielu językach, ponieważ są tłumaczone na wiele różnych języków” – powiedziała firma. Wyodrębniliśmy nagrania dźwiękowe osób czytających te teksty w różnych językach z publicznie dostępnych tłumaczeń”. Badacze Meta dodali ponad 4,000 języków do model.

Podejście to brzmi jak przepis na mocno stronniczy model sztucznej inteligencji, który faworyzuje światopogląd chrześcijański. Zanim jednak wyśmiejesz ten pomysł, rozważ go z perspektywy Meta: Badacze uważają, że tak jest, ponieważ stosują koneksjonistyczną klasyfikację czasową CTC (lub model sekwencja-sekwencja lub model typu sekwencyjnego), który jest znacznie bardziej ograniczony pod względem mocy obliczeniowej w porównaniu z duże modele językowe (znane również jako typy sekwencji) lub modele sekwencyjne do rozpoznawania mowy. Meta mówi, że nie spowodowało to męskiego uprzedzenia w nagraniach religijnych nagranych przez większość mówców płci męskiej.

Meta użyła wav2vec 2.0, modelu „samonadzorowanego uczenia się reprezentacji mowy”, aby wyszkolić wav2vec 2.0 model wyrównania co czyni dane bardziej użytecznymi. Samonadzorowany model mowy, który Meta samonadzorował na podstawie nieoznakowanych danych, doprowadził do świetnych wyników. Meta stwierdziła, że ​​masowo wielojęzyczne modele mowy działały dobrze w porównaniu z istniejącymi modelami i obejmowały 10 razy więcej języków, szczególnie w porównaniu z Szept. Meta osiągnęła połowę wskaźnika błędów słownych, podczas gdy Massively Multilingual Speech obejmowała 11 razy więcej języków.

Meta twierdzi, że jej nowe modele zamiany mowy na tekst nie są doskonałe. Na przykład mogą błędnie przetłumaczyć słowa lub frazy, co może skutkować obraźliwą i / lub niepoprawną mową, napisała firma. Odpowiedzialny rozwój technologii AI musi odbywać się poprzez współpracę społeczności AI.

Ponieważ Meta udostępniła MMS do badań open source, ma nadzieję, że może to odwrócić trend zanikania używania języka. W tej wizji technologia wspomagająca, TTS, a nawet wirtualna i rozszerzona rzeczywistość mogą pozwolić każdemu mówić i uczyć się w swoim ojczystym języku. Stwierdzono w nim: „Wyobrażamy sobie świat, w którym technologia ma odwrotny skutek, skłaniając ludzi do utrzymywania żywych języków, ponieważ mogą uzyskiwać dostęp do informacji i korzystać z technologii, mówiąc w preferowanym języku”.

  • Ostatnio Meta ogłosił wyniki finansowe za I kwartał 2023 roku. Pomimo ostatnich działań restrukturyzacyjnych, spółka zaskoczyła inwestorów nieoczekiwanym wzrostem sprzedaży za I kwartał. Akcje wzrosły w środę o 12%.

Przeczytaj więcej powiązanych artykułów:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Więcej artykułów
Damir Jałałow
Damir Jałałow

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Apetyt instytucjonalny na ETFy Bitcoin rośnie w obliczu zmienności

Ujawnienia zawarte w zgłoszeniach 13F ujawniają, że znaczący inwestorzy instytucjonalni parają się funduszami ETF Bitcoin, co podkreśla rosnącą akceptację…

Dowiedz się więcej

Nadchodzi dzień wyroku: los CZ wisi na włosku, gdy amerykański sąd rozpatruje skargę Departamentu Sprawiedliwości

Changpeng Zhao stanie dziś przed amerykańskim sądem w Seattle wyrokiem skazującym.

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Injective łączy siły z AltLayer, aby zapewnić bezpieczeństwo ponownego stakowania w inEVM
Biznes Raport aktualności Technologia
Injective łączy siły z AltLayer, aby zapewnić bezpieczeństwo ponownego stakowania w inEVM
3 maja 2024 r.
Masa współpracuje z Tellerem, aby wprowadzić pulę pożyczek MASA, umożliwiającą zaciąganie pożyczek w USDC
rynki Raport aktualności Technologia
Masa współpracuje z Tellerem, aby wprowadzić pulę pożyczek MASA, umożliwiającą zaciąganie pożyczek w USDC
3 maja 2024 r.
Velodrome wprowadza wersję beta Superchain w nadchodzących tygodniach i rozszerza się na łańcuchy bloków warstwy 2 stosu OP
rynki Raport aktualności Technologia
Velodrome wprowadza wersję beta Superchain w nadchodzących tygodniach i rozszerza się na łańcuchy bloków warstwy 2 stosu OP
3 maja 2024 r.
CARV ogłasza partnerstwo z firmą Aethir w celu decentralizacji warstwy danych i dystrybucji nagród
Biznes Raport aktualności Technologia
CARV ogłasza partnerstwo z firmą Aethir w celu decentralizacji warstwy danych i dystrybucji nagród
3 maja 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.