Новостной репортаж Технологии
15 марта 2023

Новая модель искусственного интеллекта синтезирует реалистичную речь с помощью YouTube и подкастов

Коротко

Исследователи из Университета Карнеги-Меллон создали новую модель искусственного интеллекта, которая способна генерировать реалистичную речь, изучая видео на YouTube и подкасты.

Модель смогла изучить нюансы естественной речи, прослушав почти 900 часов контента YouTube и подкастов, что привело к более реалистичному и реалистичному синтетическому голосу.

Исследователи из Университета Карнеги-Меллона в США создали новая модель искусственного интеллекта, способная генерировать реалистичную речь, обучаясь на видео и подкастах YouTube. Модель способна воспроизводить речь различными голосами и акцентами, что делает ее потенциально полезным инструментом для таких отраслей, как развлечения и реклама. Это также может иметь последствия для тех, кто использует вспомогательные технологии для общения.

Новая модель искусственного интеллекта синтезирует реалистичную речь с помощью YouTube и подкастов.
Модель ИИ способна с высокой точностью имитировать речевые паттерны и интонации человека.

Это важное событие, так как большая часть речи, сгенерированной ИИ, оказалась безэмоциональной и монотонной из-за того, что она обычно обучается на наборах данных, где записана речь профессиональных актеров. Новую технологию можно использовать для повышения производительности виртуальных помощников и чат-ботов, делая их более привлекательными и похожими на людей. У него также есть потенциальные приложения в таких областях, как игры, образование и развлечения.

Прочитайте больше: 15 лучших криптоподкастов, которые нужно слушать в 2023 году

Однако новая модель смогла изучить нюансы естественных речевых паттернов, таких как паузы, междометия и слова-паразиты, прослушав почти 900 часов контента на YouTube и подкастов. Это привело к более реалистичному и реалистичному синтетическому голосу, который получил оценку 3.89 по пятибалльной шкале людьми, которых попросили оценить его. Это выше среднего балла, полученного аналогичными моделями ИИ (настоящий человеческий голос набрал 4.01 балла).

Потенциальные области применения этой технологии обширны и включают в себя помощь людям с нарушениями речи, улучшение навигационных систем и создание виртуальных помощников с более естественным звучанием.

  • ПодкастAI — это первый подкаст, когда-либо созданный ИИ, в котором пародируется интервью Джо Рогана со Стивом Джобсом. Этот подкаст полностью создан с помощью компьютерных алгоритмов искусственного интеллекта. ИИ был обучен для эпизода со Стивом Джобсом, используя как его биографию, так и любую интернет-запись о нем, которую удалось обнаружить. Это позволило ИИ точно воссоздать его личность.

Читайте больше статей по теме:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Другие статьи
Дамир Ялалов
Дамир Ялалов

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Безумие DOGE: анализ недавнего роста стоимости Dogecoin (DOGE)

Криптовалютная индустрия стремительно расширяется, и мем-монеты готовятся к значительному подъему. Догекоин (DOGE), ...

Узнать больше

Эволюция контента, созданного искусственным интеллектом, в Метавселенной

Появление генеративного ИИ-контента — одно из самых интересных событий в виртуальной среде…

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Scroll завершает обновление основной сети Бернулли и прогнозирует десятикратное снижение транзакционных издержек
Новостной репортаж Технологии
Scroll завершает обновление основной сети Бернулли и прогнозирует десятикратное снижение транзакционных издержек
29 апреля 2024
OKX Jumpstart перечисляет Runecoin и позволяет делать ставки BTC для получения токенов RUNE
Области применения: Новостной репортаж Технологии
OKX Jumpstart перечисляет Runecoin и позволяет делать ставки BTC для получения токенов RUNE
29 апреля 2024
Лучшие предложения этой недели, крупные инвестиции в искусственный интеллект, информационные технологии, Web3и Крипто (22-26.04)
Digest Бизнес Области применения: Технологии
Лучшие предложения этой недели, крупные инвестиции в искусственный интеллект, информационные технологии, Web3и Крипто (22-26.04)
26 апреля 2024
Виталик Бутерин прокомментировал централизацию PoW, отметив, что это был временный этап до PoS
Новостной репортаж Технологии
Виталик Бутерин прокомментировал централизацию PoW, отметив, что это был временный этап до PoS
26 апреля 2024
CRYPTOMERIA LABS PTE. ООО