Новостной репортаж Технологии
08 января 2023

VALL-E: новая модель преобразования текста в речь Microsoft с нулевым выстрелом может дублировать голос каждого за три секунды

Коротко

Трансформаторная модель TTS позволяет использовать всего лишь трехсекундный образец любого голоса. ВАЛЛ-И может произносить речь любым голосом..

Это значительный шаг вперед в направлении создания более естественно звучащих систем TTS.

Однако корпорация Майкрософт предоставила несколько образцов используемой модели, и очевидно, что это представляет собой значительный шаг вперед в технологии TTS.

С момента выпуска первой модели преобразования текста в речь (TTS) исследователи искали способы улучшить способ, которым эти системы генерируют речь. Последняя модель от Microsoft, ВАЛЛ-Э, является значительным шагом вперед в этом отношении.

VALL-E — это модель TTS на основе преобразователя, которая может генерировать речь любым голосом после прослушивания только трехсекундного фрагмента этого голоса. Это значительное улучшение по сравнению с предыдущими моделями, которым требовался гораздо более длительный период обучения для создания нового голоса.

VALL-E — это удивительный технологический прорыв, который может изменить то, как мы взаимодействуем с цифровыми медиа.
Связанная статья: Microsoft выпустила диффузионную модель, которая может построить 3D-аватар из одной фотографии человека.

Кроме того, интонация, харизма и стиль голоса сохраняются в сгенерированной речи. Это важный шаг вперед в обеспечении более естественного звучания систем TTS.

Эта модель основана на трансформере и имеет внешний вид Дейла-1. Не путать с диффузионным Dalle-2. Кода по-прежнему не хватает. И у пользователей есть некоторый скептицизм, что они это опубликуют.

Связанная статья: VALL-E от Microsoft — самая опасная мошенническая программа

Однако Microsoft выпустила несколько примеров модели в действии, и стало ясно, что это большой шаг вперед в технологии TTS.

Пример # 1:

Пример #2:

Пример # 3:

Подробнее об ИИ:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Другие статьи
Дамир Ялалов
Дамир Ялалов

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Институциональный аппетит к биткойн-ETF растет на фоне волатильности

Раскрытие информации через отчеты 13F показывает, что известные институциональные инвесторы балуются биткойн-ETF, подчеркивая растущее признание...

Узнать больше

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Injective объединяет усилия с AltLayer, чтобы внести изменения в безопасность в inEVM
Бизнес Новостной репортаж Технологии
Injective объединяет усилия с AltLayer, чтобы внести изменения в безопасность в inEVM
3 мая 2024
Masa объединяется с Teller, чтобы представить кредитный пул MASA, позволяющий заимствовать USDC на базе
Области применения: Новостной репортаж Технологии
Masa объединяется с Teller, чтобы представить кредитный пул MASA, позволяющий заимствовать USDC на базе
3 мая 2024
Velodrome запускает бета-версию Superchain в ближайшие недели и распространяется на блокчейны второго уровня стека OP
Области применения: Новостной репортаж Технологии
Velodrome запускает бета-версию Superchain в ближайшие недели и распространяется на блокчейны второго уровня стека OP
3 мая 2024
CARV объявляет о партнерстве с Aethir для децентрализации уровня данных и распределения вознаграждений
Бизнес Новостной репортаж Технологии
CARV объявляет о партнерстве с Aethir для децентрализации уровня данных и распределения вознаграждений
3 мая 2024
CRYPTOMERIA LABS PTE. ООО