Tudósítást Technológia
May 23, 2023

A Meta kifejlesztett egy nyílt forráskódú beszéd AI-t, amely több mint 4,000 beszélt nyelvet ismer fel

Röviden

A cég MMS-projektje több mint 4,000 nyelvet képes felismerni.

A legtöbb nyilvánosan bejelentett mesterségesintelligencia-projekthez hasonlóan a Meta is megosztja modelljeit és kódjait, hogy segítsen megőrizni a nyelvi sokszínűséget.

Ezzel a munkával azt remélik, hogy kis mértékben hozzájárulhatnak a világ hihetetlen nyelvi sokszínűségének megőrzéséhez.

meta létrehozott egy AI nyelvi modell, amely egy üdítő fordulat ChatGPT. A nyílt forráskódú MMS projekt a nyelvi sokszínűség megőrzése és a kutatás ösztönzése érdekében jött létre, és több mint 4,000 beszélt nyelvet képes felismerni, és több mint 1,100-ban képes szöveget (beszédet) előállítani. A cégnek van nyilvánosan kiadták modelljeit és kódjait ma, hogy előmozdítsa céljait.

„Nyilvánosan megosztjuk alkotásainkat és kódunkat, hogy a kutatói közösség többi tagját is bátorítsuk, hogy építsenek munkánkra” – írta Meta. "Ezzel a törekvésünkkel reméljük, hogy megőrizzük a világ óriási nyelvi változatosságát."

A Meta kifejlesztett egy nyílt forráskódú beszéd AI-t, amely több mint 4,000 beszélt nyelvet ismer fel

Jellemző a beszédfelismerők és a szövegfelolvasó modellek betanítása nagy mennyiségű hangon, átírási címkék nélkül. A címkék kritikusak gépi tanulás, amely képes helyesen azonosítani és osztályozni az adatokat. A következő évtizedekben eltűnni fogó nyelvek esetében azonban „ezek az adatok egyszerűen nem léteznek”, ahogy Meta magyarázza.

A Meta vallási szövegek hangfelvételeit használta fel arra, hogy nem szokványos módon gyűjtsön adatokat. "Vallási szövegek, például a Biblia fordításait használtuk, amelyeket széles körben tanulmányoztak a szövegalapú nyelvi fordítási kutatásokhoz számos nyelven, mivel sok különböző nyelvre fordítják le őket" - mondta a cég. A nyilvánosan elérhető fordításokból kinyertük a hangfelvételeket azokról az emberekről, akik különböző nyelveken olvassák ezeket a szövegeket.” A Meta kutatói több mint 4,000 nyelvet adtak hozzá modell.

A megközelítés úgy hangzik, mint egy recept egy erősen elfogult mesterséges intelligencia modellhez, amely a keresztény világnézeteket részesíti előnyben. Mielőtt azonban kigúnyolná az ötletet, gondolja át Meta szemszögéből: a kutatók úgy vélik, hogy ez a helyzet, mert egy konnekcionista CTC időbeli osztályozást (vagy szekvencia-szekvenciát vagy szekvencia-típusú modellt) alkalmaznak, amely sokkal korlátozottabb. számítási teljesítményéhez képest nagy nyelvi modellek (más néven szekvenciatípusok) vagy szekvenciális beszédfelismerési modellek. Meta azt mondja, hogy ez nem eredményezett férfi elfogultságot a legtöbb férfi beszélő által rögzített vallási felvételeken.

A Meta a wav2vec 2.0-t, egy „önfelügyelt beszédreprezentációs tanulási” modellt használta a wav2vec 2.0 betanításához igazítási modell ami felhasználhatóbbá teszi az adatokat. Az önfelügyelt beszédmodell, amelyet a Meta saját maga felügyelt címkézetlen adatokból, nagyszerű eredményekhez vezetett. A Meta azt találta, hogy a tömegesen többnyelvű beszédmodellek jól teljesítettek a meglévő modellekhez képest, és tízszer annyi nyelvet fedtek le, különösen a Suttogás. A Meta a szóhibaarány felét érte el, míg a Massively Multilingual Speech 11-szer annyi nyelvet fed le.

A Meta szerint az új beszéd-szöveg modelljei nem tökéletesek. Például előfordulhat, hogy félrefordítanak szavakat vagy kifejezéseket, ami sértő és/vagy helytelen beszédet eredményezhet – írta a cég. Az AI-technológiák felelős fejlesztését az AI-közösség együttműködésével kell megvalósítani.

Mivel a Meta kiadta az MMS-t nyílt forráskódú kutatáshoz, reméli, hogy megfordíthatja a nyelvhasználat eltűnésének tendenciáját. Ebben az elképzelésben a kisegítő technológia, a TTS, sőt a virtuális valóság és a kiterjesztett valóság technológia lehetővé teheti, hogy mindenki az anyanyelvén beszéljen és tanuljon. Ez kijelentette: „Olyan világot képzelünk el, ahol a technológia ellenkező hatást fejt ki, és arra készteti az embereket, hogy életben tartsák nyelveiket, mivel az általuk választott nyelven beszélve hozzáférhetnek az információkhoz és használhatják a technológiát.”

  • Nemrég Meta bejelentette, A közelmúltbeli átalakítási erőfeszítések ellenére a vállalat az első negyedévben váratlan árbevétel-növekedéssel lepte meg a befektetőket. A részvények árfolyama 2023%-ot erősödött szerdán.

Olvasson további kapcsolódó cikkeket:

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

További cikkek
Damir Jalalov
Damir Jalalov

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

A volatilitás közepette nő az intézményi étvágy a Bitcoin ETF-ek felé

A 13F bejelentéseken keresztül közzétett információk jelentős intézményi befektetőket tárnak fel a Bitcoin ETF-ek iránt, ami alátámasztja a ...

Tudjon meg többet

Elérkezett az ítélethirdetés napja: CZ sorsa egyensúlyban van, mivel az Egyesült Államok bírósága mérlegeli a DOJ kérelmét

Changpeng Zhao ítéletet vár ma egy seattle-i amerikai bíróságon.

Tudjon meg többet
Csatlakozzon innovatív technológiai közösségünkhöz
KATT ide
Tovább
Az Injective egyesíti erőit az AltLayerrel, hogy biztonságot nyújtson az inEVM számára
üzleti Tudósítást Technológia
Az Injective egyesíti erőit az AltLayerrel, hogy biztonságot nyújtson az inEVM számára
May 3, 2024
A Masa a Tellerrel együttműködve bevezeti a MASA hitelintézetet, amely lehetővé teszi az USDC hitelfelvételt.
piacok Tudósítást Technológia
A Masa a Tellerrel együttműködve bevezeti a MASA hitelintézetet, amely lehetővé teszi az USDC hitelfelvételt.
May 3, 2024
A Velodrome a következő hetekben elindítja a Superchain béta verzióját, és az OP Stack Layer 2 blokkláncaira is kiterjed
piacok Tudósítást Technológia
A Velodrome a következő hetekben elindítja a Superchain béta verzióját, és az OP Stack Layer 2 blokkláncaira is kiterjed
May 3, 2024
A CARV partnerséget hirdet az Aethirrel adatrétegének decentralizálása és a jutalmak elosztása érdekében
üzleti Tudósítást Technológia
A CARV partnerséget hirdet az Aethirrel adatrétegének decentralizálása és a jutalmak elosztása érdekében
May 3, 2024
CRYPTOMERIA LABS PTE. KFT.