Ziņojums Tehnoloģija
23. gada 2023. maijs

Meta ir izstrādājusi atvērtā koda runas AI, kas atpazīst vairāk nekā 4,000 runāto valodu

Īsumā

Uzņēmuma MMS projekts var atpazīt vairāk nekā 4,000 valodu.

Tāpat kā lielākā daļa citu publiski izziņoto AI projektu, Meta koplieto savus modeļus un kodu, lai palīdzētu saglabāt valodu daudzveidību.

Ar šo darbu viņi cer sniegt nelielu ieguldījumu pasaules neticamās valodu daudzveidības saglabāšanā.

meta ir izveidojis AI valodas modelis, kas ir atsvaidzinošs pavērsiens ChatGPT. Atvērtā koda MMS projekts ir izveidota, lai saglabātu valodu daudzveidību un veicinātu pētniecību, un tā var atpazīt vairāk nekā 4,000 runāto valodu un radīt tekstu (runu) vairāk nekā 1,100. Uzņēmumam ir publiski izlaista savus modeļus un kodu šodien, lai veicinātu tā mērķu sasniegšanu.

"Mēs publiski kopīgojam savus darbus un kodu, lai mudinātu citus pētnieku aprindās izmantot mūsu darbu," rakstīja Meta. "Ar šiem centieniem mēs ceram saglabāt milzīgo valodu daudzveidību pasaulē."

Meta ir izstrādājusi atvērtā koda runas AI, kas atpazīst vairāk nekā 4,000 runāto valodu

Raksturīgas ir grūtības apmācīt runas atpazinējus un teksta pārvēršanas runā modeļus lielam audio daudzumam bez transkripcijas etiķetēm. Etiķetes ir ļoti svarīgas mašīna mācīšanās, kas var pareizi identificēt un klasificēt datus. Tomēr valodām, kuras nākamajās desmitgadēs izzudīs, "šie dati vienkārši nepastāv", kā skaidro Meta.

Meta izmantoja reliģisku tekstu audioierakstus, lai savāktu datus netradicionālā veidā. "Mēs izmantojām reliģisku tekstu, piemēram, Bībeles, tulkojumus, kas ir plaši pētīti tekstu valodas tulkošanas pētījumos daudzās valodās, jo tie tiek tulkoti daudzās dažādās valodās," sacīja uzņēmums. Mēs no publiski pieejamiem tulkojumiem izvilkām audioierakstus, kuros redzami cilvēki, kuri lasa šos tekstus dažādās valodās. Meta pētnieki pievienoja vairāk nekā 4,000 valodu modelis.

Šī pieeja izklausās kā recepte ļoti neobjektīvam AI modelim, kas atbalsta kristiešu pasaules uzskatus. Tomēr, pirms ņirgāties par šo ideju, apsveriet to no Meta viedokļa: pētnieki uzskata, ka tas tā ir, jo viņi izmanto konnekcionistisku CTC laika klasifikāciju (vai secības uz secību vai secības tipa modeli), kas ir daudz ierobežotāks. skaitļošanas jauda salīdzinājumā ar lieli valodu modeļi (pazīstami arī kā secību veidi) vai runas atpazīšanas secīgie modeļi. Meta saka, ka tas neizraisīja vīriešu aizspriedumus reliģiskajos ierakstos, ko ierakstīja lielākā daļa vīriešu runātāju.

Meta izmantoja wav2vec 2.0 — “pašuzraudzītas runas attēlojuma mācīšanās” modeli, lai apmācītu wav2vec 2.0. izlīdzināšanas modelis kas padara datus izmantojamākus. Pašuzraudzītais runas modelis, ko Meta pati pārraudzīja no nemarķētiem datiem, radīja lieliskus rezultātus. Meta atklāja, ka masveida daudzvalodu runas modeļi darbojas labi salīdzinājumā ar esošajiem modeļiem un aptver 10 reizes vairāk valodu, jo īpaši salīdzinājumā ar čuksti. Meta sasniedza pusi mazāku vārdu kļūdu īpatsvaru, savukārt masveidā daudzvalodu runa aptvēra 11 reizes vairāk valodu.

Meta saka, ka tās jaunie runas-teksta modeļi nav ideāli. Piemēram, viņi var nepareizi tulkot vārdus vai frāzes, kas var izraisīt aizvainojošu un/vai nepareizu runu, raksta uzņēmums. Atbildīga AI tehnoloģiju attīstība ir jāpanāk, sadarbojoties AI kopienai.

Tā kā Meta ir izlaidusi MMS atklātā pirmkoda pētījumiem, tā cer, ka tas var mainīt valodas lietošanas izzušanas tendenci. Šajā redzējumā palīgtehnoloģijas, TTS un pat virtuālās realitātes un paplašinātās realitātes tehnoloģijas varētu ļaut ikvienam runāt un mācīties savā dzimtajā valodā. Tajā teikts: "Mēs iztēlojamies pasauli, kurā tehnoloģijai ir pretējs efekts, mudinot cilvēkus saglabāt savas valodas dzīvas, jo viņi var piekļūt informācijai un izmantot tehnoloģijas, runājot sev vēlamajā valodā."

  • Nesen Meta ir paziņojusi 2023. gada pirmā ceturkšņa finanšu rezultāti. Neskatoties uz nesenajiem restrukturizācijas centieniem, uzņēmums pārsteidza investorus ar negaidītu pārdošanas apjoma pieaugumu pirmajā ceturksnī. Trešdien akcijas pieauga par 12%.

Lasiet vairāk saistītos rakstus:

Atbildības noraidīšana

Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.

Par Autors

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Vairāk rakstus
Damirs Jalalovs
Damirs Jalalovs

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Hot Stories
Pievienojieties mūsu informatīvajam izdevumam.
Jaunākās ziņas

Nepastāvības apstākļos institucionālā apetīte pieaug pret Bitcoin ETF

Informācijas atklāšana, izmantojot 13F pieteikumus, atklāj ievērojamus institucionālos investorus, kas iesaistās Bitcoin ETF, uzsverot pieaugošo pieņemšanu ...

Uzziniet vairāk

Pienāk notiesāšanas diena: CZ liktenis ir līdzsvarā, jo ASV tiesa izskata DOJ lūgumu

Šodien ASV tiesā Sietlā Čanpens Džao ir gatavs notiesāt.

Uzziniet vairāk
Pievienojieties mūsu novatoriskajai tehnoloģiju kopienai
Lasīt vairāk
Vairāk
Injective apvieno spēkus ar AltLayer, lai nodrošinātu atkārtotu inEVM drošību
bizness Ziņojums Tehnoloģija
Injective apvieno spēkus ar AltLayer, lai nodrošinātu atkārtotu inEVM drošību
3. gada 2024. maijs
Masa sadarbojas ar Teller, lai ieviestu MASA aizdevumu fondu, ļaujot USDC aizņemties bāzē
Markets Ziņojums Tehnoloģija
Masa sadarbojas ar Teller, lai ieviestu MASA aizdevumu fondu, ļaujot USDC aizņemties bāzē
3. gada 2024. maijs
Velodrome nākamajās nedēļās izlaiž Superchain Beta versiju un izvēršas visās OP Stack Layer 2 blokķēdes
Markets Ziņojums Tehnoloģija
Velodrome nākamajās nedēļās izlaiž Superchain Beta versiju un izvēršas visās OP Stack Layer 2 blokķēdes
3. gada 2024. maijs
CARV paziņo par sadarbību ar Aethir, lai decentralizētu savu datu slāni un sadalītu atlīdzības
bizness Ziņojums Tehnoloģija
CARV paziņo par sadarbību ar Aethir, lai decentralizētu savu datu slāni un sadalītu atlīdzības
3. gada 2024. maijs
CRYPTOMERIA LABS PTE. LTD.