Ulat sa Balita Teknolohiya
Mayo 23, 2023

Nakabuo ang Meta ng isang Open-Source Speech AI na Kinikilala ang Higit sa 4,000 Mga Sinasalitang Wika

Sa madaling sabi

Ang proyekto ng MMS ng kumpanya ay maaaring makilala ang higit sa 4,000 mga wika.

Tulad ng karamihan sa iba pang mga proyektong AI na inihayag sa publiko, ibinabahagi ng Meta ang mga modelo at code nito upang makatulong na mapanatili ang pagkakaiba-iba ng wika.

Sa pamamagitan ng gawaing ito, umaasa silang makagawa ng maliit na kontribusyon sa pagpapanatili ng hindi kapani-paniwalang pagkakaiba-iba ng wika sa mundo.

meta ay lumikha isang AI language model na nakakapreskong twist ChatGPT. Ang open-source proyekto ng MMS ay nilikha upang mapanatili ang pagkakaiba-iba ng wika at hikayatin ang pananaliksik at maaaring makilala ang higit sa 4,000 sinasalitang wika at makagawa ng teksto (speech) sa mahigit 1,100. Ang kumpanya ay may inilabas sa publiko ang mga modelo at code nito ngayon upang isulong ang mga layunin nito.

"Ibinabahagi namin sa publiko ang aming mga nilikha at code upang hikayatin ang iba sa komunidad ng pananaliksik na buuin ang aming trabaho," sumulat si Meta. "Sa pamamagitan ng pagsisikap na ito, umaasa kaming mapangalagaan ang napakalaking pagkakaiba-iba ng wika sa mundo."

Nakabuo ang Meta ng Open-Source Speech AI na Kinikilala ang Higit sa 4,000 Spoken Languages

Ang hirap ng pagsasanay sa mga speech recogniser at text-to-speech na mga modelo sa malalaking dami ng audio na walang mga transcription label ay karaniwan. Ang mga label ay kritikal sa machine learning, na maaaring matukoy at maiuri nang tama ang data. Gayunpaman, para sa mga wikang mawawala sa mga darating na dekada, "ang data na ito ay hindi umiiral," gaya ng paliwanag ng Meta.

Gumamit ang Meta ng mga audio recording ng mga relihiyosong teksto upang mangolekta ng data sa hindi kinaugalian na paraan. "Gumamit kami ng mga pagsasalin ng mga relihiyosong teksto tulad ng Bibliya, na malawakang pinag-aralan para sa pananaliksik sa pagsasalin ng wika na nakabatay sa teksto sa maraming wika dahil isinalin ang mga ito sa maraming iba't ibang wika," sabi ng kumpanya. Kinuha namin ang mga audio recording ng mga taong nagbabasa ng mga tekstong ito sa iba't ibang wika mula sa mga pampublikong pagsasalin." Nagdagdag ang mga mananaliksik ng Meta ng mahigit 4,000 wika sa modelo.

Ang diskarte ay parang isang recipe para sa isang mabigat na bias na modelo ng AI na pinapaboran ang mga pananaw sa mundo ng mga Kristiyano. Gayunpaman, bago mo kutyain ang ideya, isaalang-alang ito mula sa pananaw ng Meta: Naniniwala ang mga mananaliksik na ito ang kaso dahil gumagamit sila ng isang connectionist na CTC temporal classification (o sequence-to-sequence o sequence-type na modelo) na mas limitado sa mga tuntunin ng computational power kumpara sa malalaking modelo ng wika (kilala rin bilang mga uri ng pagkakasunud-sunod) o mga sunud-sunod na modelo para sa pagkilala sa pagsasalita. Sinabi ng Meta na hindi ito nagresulta sa pagkiling ng lalaki sa mga relihiyosong pag-record na naitala ng karamihan sa mga nagsasalita ng lalaki.

Gumamit ang Meta ng wav2vec 2.0, isang modelong "self-supervised speech representation learning", upang sanayin ang isang wav2vec 2.0 modelo ng pagkakahanay na ginagawang mas magagamit ang data. Ang self-supervised speech model na ang Meta na self-supervised mula sa walang label na data ay humantong sa magagandang resulta. Nalaman ng Meta na ang napakalaking multilingguwal na mga modelo ng pagsasalita ay mahusay na gumanap kumpara sa mga umiiral na modelo at sumasaklaw ng 10 beses na mas maraming mga wika, partikular na kumpara sa Paanas. Nakamit ng Meta ang kalahati ng rate ng error sa salita, habang ang Massively Multilingual Speech ay sumasakop ng 11 beses na mas maraming mga wika.

Sinabi ng Meta na hindi perpekto ang mga bagong speech-to-text na modelo nito. Halimbawa, maaari silang magkamali sa pagsasalin ng mga salita o parirala, na maaaring magresulta sa nakakasakit at/o maling pananalita, isinulat ng kumpanya. Ang responsableng pagpapaunlad ng mga teknolohiya ng AI ay dapat maisakatuparan sa pamamagitan ng pakikipagtulungan sa komunidad ng AI.

Habang inilabas ng Meta ang MMS para sa open-source na pananaliksik, umaasa itong mababaligtad nito ang takbo ng pagkawala ng paggamit ng wika. Sa pananaw na ito, ang assistive technology, TTS, at maging ang virtual reality at augmented reality tech ay maaaring magbigay-daan sa lahat na magsalita at matuto sa kanilang mga katutubong wika. Nakasaad dito, "Naiisip namin ang isang mundo kung saan ang teknolohiya ay may kabaligtaran na epekto, na nag-uudyok sa mga tao na panatilihing buhay ang kanilang mga wika dahil maaari nilang ma-access ang impormasyon at gumamit ng teknolohiya sa pamamagitan ng pagsasalita sa kanilang ginustong wika."

  • Kamakailan, Meta ay inihayag mga resulta sa pananalapi para sa unang quarter ng 2023. Sa kabila ng kamakailang mga pagsusumikap sa muling pagsasaayos, ginulat ng kumpanya ang mga mamumuhunan sa hindi inaasahang pagtaas ng mga benta para sa unang quarter. Ang mga pagbabahagi ay tumaas ng 12% noong Miyerkules.

Magbasa nang higit pa mga nauugnay na artikulo:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Ang Institutional Appetite ay Lumalaki Patungo sa Bitcoin ETFs Sa gitna ng Volatility

Ang mga pagsisiwalat sa pamamagitan ng 13F filing ay nagpapakita ng mga kilalang institusyonal na mamumuhunan na nakikipag-ugnayan sa mga Bitcoin ETF, na binibigyang-diin ang lumalaking pagtanggap ng ...

Malaman Higit Pa

Dumating na ang Araw ng Pagsentensiya: Ang Kapalaran ni CZ ay Nagbabalanse habang Isinasaalang-alang ng Korte ng US ang Panawagan ng DOJ

Si Changpeng Zhao ay handang harapin ang sentensiya sa korte ng US sa Seattle ngayon.

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Pinagsama-sama ng Injective ang AltLayer Upang Magdala ng Restaking Security Sa inEVM
Negosyo Ulat sa Balita Teknolohiya
Pinagsama-sama ng Injective ang AltLayer Upang Magdala ng Restaking Security Sa inEVM
Mayo 3, 2024
Nakipagtulungan ang Masa Sa Teller Upang Ipakilala ang MASA Lending Pool, Pinapagana ang USDC Borrowing On Base
markets Ulat sa Balita Teknolohiya
Nakipagtulungan ang Masa Sa Teller Upang Ipakilala ang MASA Lending Pool, Pinapagana ang USDC Borrowing On Base
Mayo 3, 2024
Inilunsad ng Velodrome ang Superchain Beta na Bersyon Sa Mga Paparating na Linggo At Lumalawak sa OP Stack Layer 2 Blockchain
markets Ulat sa Balita Teknolohiya
Inilunsad ng Velodrome ang Superchain Beta na Bersyon Sa Mga Paparating na Linggo At Lumalawak sa OP Stack Layer 2 Blockchain
Mayo 3, 2024
Inanunsyo ng CARV ang Pakikipagsosyo Sa Aethir Upang I-desentralisa ang Layer ng Data Nito At Ipamahagi ang Mga Gantimpala
Negosyo Ulat sa Balita Teknolohiya
Inanunsyo ng CARV ang Pakikipagsosyo Sa Aethir Upang I-desentralisa ang Layer ng Data Nito At Ipamahagi ang Mga Gantimpala
Mayo 3, 2024
CRYPTOMERIA LABS PTE. LTD.