Novice Tehnologija
Maj 23, 2023

Meta je razvila odprtokodno umetno inteligenco za govor, ki prepozna več kot 4,000 govorjenih jezikov

Na kratko

MMS projekt podjetja lahko prepozna več kot 4,000 jezikov.

Tako kot večina drugih javno objavljenih projektov umetne inteligence tudi Meta deli svoje modele in kodo, da pomaga ohranjati jezikovno raznolikost.

S tem delom upajo, da bodo malo prispevali k ohranjanju neverjetne jezikovne raznolikosti sveta.

Meta je ustvaril jezikovni model AI, ki je osvežujoč pridih ChatGPT. Odprtokodni MMS projekt je bil ustvarjen za ohranjanje jezikovne raznolikosti in spodbujanje raziskav ter lahko prepozna več kot 4,000 govorjenih jezikov in ustvari besedilo (govor) v več kot 1,100. Podjetje ima javno objavljeno svoje modele in kodo danes za doseganje svojih ciljev.

»Javno delimo svoje stvaritve in kodo, da bi spodbudili druge v raziskovalni skupnosti, da gradijo na našem delu,« je zapisala Meta. "Upamo, da bomo s tem prizadevanjem ohranili izjemno jezikovno raznolikost sveta."

Meta je razvila odprtokodno umetno inteligenco za govor, ki prepozna več kot 4,000 govorjenih jezikov

Značilna je težava pri urjenju prepoznavalcev govora in modelov besedila v govor na velikih količinah zvoka brez prepisnih oznak. Oznake so ključnega pomena za strojno učenje, ki lahko pravilno identificira in razvrsti podatke. Vendar pa za jezike, ki bodo v prihodnjih desetletjih izginili, "ti podatki preprosto ne obstajajo", kot pojasnjuje Meta.

Meta je z zvočnimi posnetki verskih besedil zbirala podatke na nekonvencionalen način. "Uporabili smo prevode verskih besedil, kot je Sveto pismo, ki so bili obsežno preučeni za raziskave prevajanja jezikov, ki temeljijo na besedilih v številnih jezikih, ker so prevedeni v veliko različnih jezikov," so sporočili iz podjetja. Iz javno dostopnih prevodov smo izluščili zvočne posnetke ljudi, ki berejo ta besedila v različnih jezikih.« Metini raziskovalci so dodali več kot 4,000 jezikov Model.

Pristop zveni kot recept za močno pristranski model AI, ki daje prednost krščanskemu pogledu na svet. Toda preden se posmehujete ideji, razmislite o njej z Metine perspektive: Raziskovalci menijo, da je temu tako, ker uporabljajo povezniško časovno klasifikacijo CTC (ali model od zaporedja do zaporedja ali model zaporedja), ki je veliko bolj omejen v smislu računske moči v primerjavi z veliki jezikovni modeli (znani tudi kot tipi zaporedja) ali zaporedni modeli za prepoznavanje govora. Meta pravi, da to ni povzročilo moške pristranskosti v verskih zapisih, ki jih posname večina moških govorcev.

Meta je uporabila wav2vec 2.0, model »samonadzorovanega učenja predstavitve govora«, za usposabljanje wav2vec 2.0 model poravnave zaradi česar so podatki bolj uporabni. Model samonadzorovanega govora, ki ga je Meta samonadzorovala iz neoznačenih podatkov, je prinesel odlične rezultate. Meta je ugotovila, da so se množično večjezični govorni modeli dobro obnesli v primerjavi z obstoječimi modeli in so pokrivali 10-krat več jezikov, zlasti v primerjavi z Šepetanje. Meta je dosegla polovico nižjo stopnjo besednih napak, medtem ko je Massively Multilingual Speech pokril 11-krat več jezikov.

Meta pravi, da njeni novi modeli govora v besedilo niso popolni. Lahko bi na primer napačno prevedli besede ali besedne zveze, kar bi lahko povzročilo žaljiv in/ali nepravilen govor, so zapisali v podjetju. Odgovoren razvoj tehnologij umetne inteligence je treba doseči s sodelovanjem med skupnostjo umetne inteligence.

Ker je Meta izdala MMS za odprtokodne raziskave, upa, da bo lahko obrnila trend izginjanja jezikovne rabe. V tej viziji bi lahko podporna tehnologija, TTS in celo navidezna resničnost in tehnologija obogatene resničnosti vsem omogočili, da govorijo in se učijo v svojih maternih jezikih. V njem je bilo zapisano: "Predstavljamo si svet, v katerem ima tehnologija nasprotni učinek, saj ljudi spodbuja k ohranjanju svojih jezikov, saj lahko dostopajo do informacij in uporabljajo tehnologijo tako, da govorijo v svojem najljubšem jeziku."

  • Nedavno, Meta je napovedal, finančni rezultati za prvo četrtletje 2023. Kljub nedavnim prizadevanjem za prestrukturiranje je podjetje vlagatelje presenetilo z nepričakovano rastjo prodaje za prvo četrtletje. Delnice so v sredo zrasle za 12 %.

Preberite več sorodnih člankov:

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

več člankov
Damir Yalalov
Damir Yalalov

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

Institucionalni apetit raste proti Bitcoin ETF-jem sredi volatilnosti

Razkritja prek vlog 13F razkrivajo pomembne institucionalne vlagatelje, ki se ukvarjajo z Bitcoin ETF, kar poudarja vse večje sprejemanje ...

Več o tem

Prihaja dan obsodbe: usoda CZ visi na ravnovesju, ko ameriško sodišče obravnava tožbeni razlog DOJ

Changpeng Zhao se danes sooča z obsodbo na ameriškem sodišču v Seattlu.

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
Injective združuje moči z AltLayer, da bi v inEVM prinesel varnost preoblikovanja
ŽELITE POSTATI PARTNER Novice Tehnologija
Injective združuje moči z AltLayer, da bi v inEVM prinesel varnost preoblikovanja
Maj 3, 2024
Masa se združuje s podjetjem Teller, da uvede MASA Lending Pool, ki omogoča izposojo USDC na osnovi
Prisotnost Novice Tehnologija
Masa se združuje s podjetjem Teller, da uvede MASA Lending Pool, ki omogoča izposojo USDC na osnovi
Maj 3, 2024
Velodrome v prihodnjih tednih lansira različico Superchain Beta in se širi po verigah blokov plasti 2 sklada OP
Prisotnost Novice Tehnologija
Velodrome v prihodnjih tednih lansira različico Superchain Beta in se širi po verigah blokov plasti 2 sklada OP
Maj 3, 2024
CARV napoveduje partnerstvo z Aethirjem za decentralizacijo njegove podatkovne plasti in razdeljevanje nagrad
ŽELITE POSTATI PARTNER Novice Tehnologija
CARV napoveduje partnerstvo z Aethirjem za decentralizacijo njegove podatkovne plasti in razdeljevanje nagrad
Maj 3, 2024
CRYPTOMERIA LABS PTE. LTD.