Новини Технологии
Май 23, 2023

Meta разработи AI с отворен код за реч, който разпознава над 4,000 говорими езика

Накратко

MMS проектът на компанията може да разпознава над 4,000 езика.

Подобно на повечето от другите си публично обявени AI проекти, Meta споделя своите модели и код, за да помогне за запазването на езиковото разнообразие.

Чрез тази работа те се надяват да дадат малък принос за запазването на невероятното езиково разнообразие на света.

Meta е създаден AI езиков модел, който е освежаващ обрат ChatGPT. Отвореният код MMS проект е създаден, за да запази езиковото многообразие и да насърчи изследванията и може да разпознае повече от 4,000 говорими езика и да създаде текст (говор) на над 1,100. Компанията има публично пуснат своите модели и код днес, за да постигне своите цели.

„Ние публично споделяме нашите творения и код, за да насърчим другите в изследователската общност да надграждат върху нашата работа“, пише Мета. „Чрез това начинание се надяваме да запазим огромното езиково разнообразие на света.“

Meta разработи AI с отворен код за реч, който разпознава над 4,000 говорими езика

Трудността при обучението на устройства за разпознаване на реч и модели за текст към реч върху големи количества аудио без етикети за транскрипция е типична. Етикетите са критични за машинно обучение, който може правилно да идентифицира и класифицира данни. Въпреки това, за езици, които ще изчезнат през следващите десетилетия, „тези данни просто не съществуват“, както обяснява Мета.

Meta използва аудиозаписи на религиозни текстове, за да събира данни по нетрадиционен начин. „Използвахме преводи на религиозни текстове като Библията, които бяха широко проучени за изследване на превода на текстови езици на много езици, защото се превеждат на много различни езици“, казаха от компанията. Извлякохме аудиозаписи на хора, които четат тези текстове на различни езици от публично достъпни преводи. Изследователите на Meta добавиха над 4,000 езика към модел.

Подходът звучи като рецепта за силно предубеден AI модел, който благоприятства християнския мироглед. Въпреки това, преди да се присмивате на идеята, помислете за нея от гледна точка на Мета: Изследователите вярват, че това е така, защото използват конекционистка CTC времева класификация (или модел от последователност към последователност или модел от тип последователност), която е много по-ограничена по отношение на изчислителната мощност в сравнение с големи езикови модели (известни също като типове последователност) или последователни модели за разпознаване на реч. Мета казва, че това не е довело до мъжки пристрастия в религиозните записи, записани от повечето говорители мъже.

Meta използва wav2vec 2.0, модел за „самоконтролирано обучение за представяне на реч“, за да обучи wav2vec 2.0 модел на подравняване което прави данните по-използваеми. Моделът на самоконтролирана реч, който Meta самоконтролира от немаркирани данни, доведе до страхотни резултати. Meta установи, че масовите многоезични модели на реч се представят добре в сравнение със съществуващите модели и покриват 10 пъти повече езици, особено в сравнение с Шепот. Meta постигна половината от процента на грешки в думата, докато Massively Multilingual Speech обхваща 11 пъти повече езици.

Meta казва, че новите му модели за реч към текст не са перфектни. Например, те могат да преведат неправилно думи или фрази, което може да доведе до обидна и/или неправилна реч, пише компанията. Отговорното развитие на AI технологиите трябва да бъде постигнато чрез сътрудничество между общността на AI.

Тъй като Meta пусна MMS за изследване с отворен код, се надява, че може да обърне тенденцията на изчезване на използването на езика. В тази визия помощните технологии, TTS и дори технологиите за виртуална реалност и добавена реалност могат да позволят на всеки да говори и учи на родния си език. В него се казва: „Ние си представяме свят, в който технологията има обратен ефект, карайки хората да поддържат езиците си живи, тъй като имат достъп до информация и използват технологии, като говорят на предпочитания от тях език.“

  • Наскоро Мета обяви финансови резултати за първото тримесечие на 2023 г. Въпреки скорошните усилия за преструктуриране, компанията изненада инвеститорите с неочаквано увеличение на продажбите за първото тримесечие. Акциите скочиха с 12% в сряда.

Прочетете още свързани статии:

Отказ от отговорност

В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.

За автора

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Още статии
Дамир Ялалов
Дамир Ялалов

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Hot Stories
Присъединете се към нашия бюлетин.
Последни новини

Институционалният апетит нараства към биткойн ETF на фона на волатилност

Оповестяванията чрез документи 13F разкриват забележителни институционални инвеститори, занимаващи се с биткойн ETF, което подчертава нарастващото приемане на...

Научете още

Пристига денят на присъдата: Съдбата на CZ виси на равновесие, докато американският съд разглежда молбата на DOJ

Changpeng Zhao е готов да бъде осъден днес в американски съд в Сиатъл.

Научете още
Присъединете се към нашата иновативна техническа общност
Вижте повече
Прочети повече
Injective обединява усилията си с AltLayer, за да внесе повторно залагане на сигурност в inEVM
Бизнес Новини Технологии
Injective обединява усилията си с AltLayer, за да внесе повторно залагане на сигурност в inEVM
Май 3, 2024
Masa се обединява с Teller, за да въведе MASA Lending Pool, позволяващ USDC заемане на база
пазари Новини Технологии
Masa се обединява с Teller, за да въведе MASA Lending Pool, позволяващ USDC заемане на база
Май 3, 2024
Velodrome пуска бета версия на Superchain през следващите седмици и се разширява в OP Stack Layer 2 Blockchains
пазари Новини Технологии
Velodrome пуска бета версия на Superchain през следващите седмици и се разширява в OP Stack Layer 2 Blockchains
Май 3, 2024
CARV обявява партньорство с Aethir за децентрализиране на своя слой данни и разпределяне на награди
Бизнес Новини Технологии
CARV обявява партньорство с Aethir за децентрализиране на своя слой данни и разпределяне на награди
Май 3, 2024
CRYPTOMERIA LABS PTE. LTD.