Новински извештај технологија
Januar 08, 2023

ВАЛЛ-Е: Мицрософтов нови модел претварања текста у говор може да дуплира свачији глас за три секунде

Укратко

Са само три секунде узорка било ког гласа, ТТС модел заснован на трансформатору ВАЛЛ-Е може произвести говор у сваком гласу.

Ово је значајан напредак у правцу ТТС система који звуче природније.

Мицрософт је, међутим, обезбедио неколико примерака модела у употреби, и очигледно је да ово представља значајан напредак у ТТС технологији.

Од објављивања првог модела текста у говор (ТТС), истраживачи су тражили начине да побољшају начин на који ови системи генеришу говор. Најновији модел из Мицрософта, ВАЛЛ-Е, представља значајан корак напред у том погледу.

ВАЛЛ-Е је ТТС модел заснован на трансформатору који може да генерише говор било којим гласом након што чује само три секунде узорка тог гласа. Ово је значајно побољшање у односу на претходне моделе, који су захтевали много дужи период обуке да би се генерисао нови глас.

ВАЛЛ-Е је невероватан технолошки подвиг који има потенцијал да промени начин на који комуницирамо са дигиталним медијима.
Повезани чланак: Мицрософт је објавио модел дифузије који може да направи 3Д аватар од једне фотографије особе

Поред тога, интонација, харизма и стил гласа остају нетакнути у генерисаном говору. Ово је важан корак напред у томе да ТТС системи звуче природније.

Овај модел је заснован на трансформатору и има изглед Дале-1. Не треба мешати са Далле-2 базираним на дифузији. Код и даље недостаје. И корисници имају одређени скептицизам да ће га објавити.

Повезани чланак: Чини се да је Мицрософтов ВАЛЛ-Е најопаснији софтвер за превару икада

Међутим, Мицрософт је објавио неколико примера модела у акцији и јасно је да је ово велики напредак у ТТС технологији.

Пример #КСНУМКС:

Пример #2:

Пример #КСНУМКС:

Прочитајте више о АИ:

Одрицање од одговорности

У складу са Смернице пројекта Труст, имајте на уму да информације дате на овој страници нису намењене и не треба да се тумаче као правни, порески, инвестициони, финансијски или било који други облик савета. Важно је да инвестирате само оно што можете приуштити да изгубите и да тражите независан финансијски савет ако сумњате. За додатне информације, предлажемо да погледате одредбе и услове, као и странице помоћи и подршке које пружа издавач или оглашивач. MetaversePost је посвећен тачном, непристрасном извештавању, али тржишни услови су подложни променама без претходне најаве.

О аутору

Дамир је вођа тима, менаџер производа и уредник у Metaverse Post, покривајући теме као што су АИ/МЛ, АГИ, ЛЛМ, Метаверсе и Web3-сродна поља. Његови чланци привлаче огромну публику од преко милион корисника сваког месеца. Чини се да је стручњак са 10 година искуства у СЕО и дигиталном маркетингу. Дамир се помиње у Масхабле, Виред, Cointelegraph, Тхе Нев Иоркер, Инсиде.цом, Ентрепренеур, БеИнЦрипто и друге публикације. Путује између УАЕ, Турске, Русије и ЗНД као дигитални номад. Дамир је стекао диплому физике, за коју верује да му је дало вештине критичког размишљања које су му потребне да буде успешан у свету интернета који се стално мења. 

više чланака
Дамир Иалалов
Дамир Иалалов

Дамир је вођа тима, менаџер производа и уредник у Metaverse Post, покривајући теме као што су АИ/МЛ, АГИ, ЛЛМ, Метаверсе и Web3-сродна поља. Његови чланци привлаче огромну публику од преко милион корисника сваког месеца. Чини се да је стручњак са 10 година искуства у СЕО и дигиталном маркетингу. Дамир се помиње у Масхабле, Виред, Cointelegraph, Тхе Нев Иоркер, Инсиде.цом, Ентрепренеур, БеИнЦрипто и друге публикације. Путује између УАЕ, Турске, Русије и ЗНД као дигитални номад. Дамир је стекао диплому физике, за коју верује да му је дало вештине критичког размишљања које су му потребне да буде успешан у свету интернета који се стално мења. 

Hot Stories
Придружите се нашем билтену.
Најновије вести

Институционални апетит расте према Битцоин ЕТФ-овима усред волатилности

Откривања путем 13Ф поднесака откривају значајне институционалне инвеститоре који се баве Битцоин ЕТФ-овима, наглашавајући све веће прихватање ...

Знате више

Стиже дан изрицања пресуде: Судбина ЦЗ-а виси у равнотежи док амерички суд разматра изјашњење Министарства правде

Цхангпенг Зхао се данас суочава са изрицањем казне на америчком суду у Сијетлу.

Знате више
Придружите се нашој заједници иновативних технологија
Опширније
opširnije
Последње упозорење Едварда Сноудена за Битцоин програмере: „Учините приватност приоритетом на нивоу протокола или ризикујте да је изгубите
tržišta безбедност Wiki софтвер Приче и критике технологија
Последње упозорење Едварда Сноудена за Битцоин програмере: „Учините приватност приоритетом на нивоу протокола или ризикујте да је изгубите
Може 10, 2024
Етхереум Лаиер 2 Нетворк Минт покреће своју мрежу 15. маја
Новински извештај технологија
Етхереум Лаиер 2 Нетворк Минт покреће своју мрежу 15. маја
Може 10, 2024
Најбоље понуде ове недеље, велике инвестиције у вештачку интелигенцију, ИТ, Web3, и Црипто (06-10.04)
Дигест Posao tržišta софтвер технологија
Најбоље понуде ове недеље, велике инвестиције у вештачку интелигенцију, ИТ, Web3, и Црипто (06-10.04)
Може 10, 2024
СтаФи интегрише подршку за ЕигенЛаиер-ов ЛРТ у свој Ликуид-Стакинг-ас-а-Сервице Стацк
tržišta Новински извештај технологија
СтаФи интегрише подршку за ЕигенЛаиер-ов ЛРТ у свој Ликуид-Стакинг-ас-а-Сервице Стацк
Може 10, 2024
ЦРИПТОМЕРИА ЛАБС ПТЕ. ЛТД.