Novinová správa Technológia
Môže 23, 2023

Meta vyvinula umelú inteligenciu s otvoreným zdrojom, ktorá rozpoznáva viac ako 4,000 XNUMX hovorených jazykov

Stručne

Projekt spoločnosti MMS dokáže rozpoznať viac ako 4,000 jazykov.

Rovnako ako väčšina ostatných verejne oznámených projektov AI, aj Meta zdieľa svoje modely a kód, aby pomohla zachovať jazykovú rozmanitosť.

Prostredníctvom tejto práce dúfajú, že malým dielom prispejú k zachovaniu neuveriteľnej jazykovej rozmanitosti sveta.

meta vytvoril jazykový model AI, ktorý je osviežujúcim obratom ChatGPT. Otvorený zdroj Projekt MMS bol vytvorený s cieľom zachovať jazykovú rozmanitosť a podporiť výskum a dokáže rozpoznať viac ako 4,000 1,100 hovorených jazykov a vytvoriť text (reč) vo viac ako XNUMX XNUMX. Spoločnosť má verejne prepustený svoje modely a kód dnes na podporu svojich cieľov.

„Verejne zdieľame naše výtvory a kód, aby sme povzbudili ostatných vo výskumnej komunite, aby stavali na našej práci,“ napísal Meta. "Dúfame, že týmto úsilím zachováme obrovskú jazykovú rozmanitosť sveta."

Meta vyvinula umelú inteligenciu s otvoreným zdrojom, ktorá rozpoznáva viac ako 4,000 XNUMX hovorených jazykov

Typické sú ťažkosti s trénovaním rozpoznávačov reči a modelov prevodu textu na reč na veľkom množstve zvuku bez transkripčných štítkov. Štítky sú rozhodujúce pre strojové učenie, ktorý dokáže správne identifikovať a klasifikovať údaje. Avšak pre jazyky, ktoré v najbližších desaťročiach zmiznú, „tieto údaje jednoducho neexistujú“, ako vysvetľuje Meta.

Meta použila zvukové nahrávky náboženských textov na zber údajov netradičným spôsobom. „Použili sme preklady náboženských textov, ako je Biblia, ktoré boli široko študované na výskum prekladu jazykov založených na texte v mnohých jazykoch, pretože sú preložené do mnohých rôznych jazykov,“ uviedla spoločnosť. Z verejne dostupných prekladov sme vytiahli zvukové nahrávky ľudí, ktorí čítajú tieto texty v rôznych jazykoch.“ Výskumníci z Meta pridali viac ako 4,000 XNUMX jazykov model.

Tento prístup znie ako recept na silne zaujatý model AI, ktorý uprednostňuje kresťanské svetonázory. Predtým, ako sa však tejto myšlienke posmievate, zvážte ju z perspektívy Meta: Výskumníci sa domnievajú, že je to tak, pretože používajú konekcionistickú dočasnú klasifikáciu CTC (alebo model sekvenčného typu alebo model sekvenčného typu), ktorý je z hľadiska výrazov oveľa obmedzenejší. výpočtového výkonu v porovnaní s veľké jazykové modely (známe aj ako sekvenčné typy) alebo sekvenčné modely na rozpoznávanie reči. Meta hovorí, že to neviedlo k mužskej zaujatosti v náboženských nahrávkach zaznamenaných väčšinou mužských rečníkov.

Meta použila na trénovanie wav2vec 2.0 wav2vec 2.0, model „učenia sa reprezentácie reči s vlastným dohľadom“ model zarovnania vďaka tomu sú údaje použiteľnejšie. Samokontrolovaný rečový model, ktorý Meta sama kontrolovala z neoznačených údajov, viedol k skvelým výsledkom. Meta zistila, že masívne viacjazyčné modely reči fungovali dobre v porovnaní s existujúcimi modelmi a pokrývali 10-krát viac jazykov, najmä v porovnaní s šepot. Meta dosiahla polovičnú chybovosť slov, zatiaľ čo Massively Multilingual Speech pokrýval 11-krát viac jazykov.

Meta hovorí, že jej nové modely prevodu reči na text nie sú dokonalé. Mohli by napríklad nesprávne preložiť slová alebo frázy, čo by mohlo viesť k urážlivým a/alebo nesprávnym prejavom, napísala spoločnosť. Zodpovedný vývoj technológií AI sa musí dosiahnuť prostredníctvom spolupráce medzi komunitou AI.

Keďže Meta vydala MMS pre open-source výskum, dúfa, že dokáže zvrátiť trend miznutia používania jazyka. V tejto vízii môžu asistenčné technológie, TTS a dokonca aj technológia virtuálnej reality a rozšírenej reality umožniť každému hovoriť a učiť sa vo svojom rodnom jazyku. Uvádzalo sa v ňom: „Predstavujeme si svet, v ktorom má technológia opačný efekt, ktorý podnecuje ľudí, aby udržiavali svoje jazyky pri živote, pretože môžu pristupovať k informáciám a používať technológie tak, že budú hovoriť vo svojom preferovanom jazyku.

  • Nedávno, Meta oznámila finančné výsledky za prvý štvrťrok 2023. Napriek nedávnemu úsiliu o reštrukturalizáciu spoločnosť prekvapila investorov nečakaným nárastom tržieb za prvý štvrťrok. Akcie v stredu vzrástli o 12 %.

Prečítajte si ďalšie súvisiace články:

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Ďalšie články
Damir Yalalov
Damir Yalalov

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Inštitucionálny apetít rastie smerom k bitcoinovým ETF uprostred volatility

Zverejnenia prostredníctvom podaní 13F odhaľujú pozoruhodných inštitucionálnych investorov, ktorí sa venujú bitcoinovým ETF, čo podčiarkuje rastúcu akceptáciu ...

vedieť viac

Prichádza deň odsúdenia: Osud CZ visí v rovnováhe, pretože americký súd zvažuje žalobu ministerstva spravodlivosti

Changpeng Zhao dnes čaká na americkom súde v Seattli odsúdenie.

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
Injective spája svoje sily s AltLayer, aby priniesla bezpečnosť pri prestavbe inEVM
firmy Novinová správa Technológia
Injective spája svoje sily s AltLayer, aby priniesla bezpečnosť pri prestavbe inEVM
Môže 3, 2024
Masa sa spojila so spoločnosťou Teller, aby predstavila fond pôžičiek MASA a umožnila požičiavanie USDC na základni
trhy Novinová správa Technológia
Masa sa spojila so spoločnosťou Teller, aby predstavila fond pôžičiek MASA a umožnila požičiavanie USDC na základni
Môže 3, 2024
Velodrome uvádza na trh beta verziu Superchain v najbližších týždňoch a rozširuje sa o blockchainy OP Stack Layer 2
trhy Novinová správa Technológia
Velodrome uvádza na trh beta verziu Superchain v najbližších týždňoch a rozširuje sa o blockchainy OP Stack Layer 2
Môže 3, 2024
CARV oznamuje partnerstvo so spoločnosťou Aethir s cieľom decentralizovať svoju dátovú vrstvu a distribuovať odmeny
firmy Novinová správa Technológia
CARV oznamuje partnerstvo so spoločnosťou Aethir s cieľom decentralizovať svoju dátovú vrstvu a distribuovať odmeny
Môže 3, 2024
CRYPTOMERIA LABS PTE. LTD.