Новая модель искусственного интеллекта синтезирует реалистичную речь с помощью YouTube и подкастов
Коротко
Исследователи из Университета Карнеги-Меллон создали новую модель искусственного интеллекта, которая способна генерировать реалистичную речь, изучая видео на YouTube и подкасты.
Модель смогла изучить нюансы естественной речи, прослушав почти 900 часов контента YouTube и подкастов, что привело к более реалистичному и реалистичному синтетическому голосу.
Исследователи из Университета Карнеги-Меллона в США создали новая модель искусственного интеллекта, способная генерировать реалистичную речь, обучаясь на видео и подкастах YouTube. Модель способна воспроизводить речь различными голосами и акцентами, что делает ее потенциально полезным инструментом для таких отраслей, как развлечения и реклама. Это также может иметь последствия для тех, кто использует вспомогательные технологии для общения.
Это важное событие, так как большая часть речи, сгенерированной ИИ, оказалась безэмоциональной и монотонной из-за того, что она обычно обучается на наборах данных, где записана речь профессиональных актеров. Новую технологию можно использовать для повышения производительности виртуальных помощников и чат-ботов, делая их более привлекательными и похожими на людей. У него также есть потенциальные приложения в таких областях, как игры, образование и развлечения.
Прочитайте больше: 15 лучших криптоподкастов, которые нужно слушать в 2023 году |
Однако новая модель смогла изучить нюансы естественных речевых паттернов, таких как паузы, междометия и слова-паразиты, прослушав почти 900 часов контента на YouTube и подкастов. Это привело к более реалистичному и реалистичному синтетическому голосу, который получил оценку 3.89 по пятибалльной шкале людьми, которых попросили оценить его. Это выше среднего балла, полученного аналогичными моделями ИИ (настоящий человеческий голос набрал 4.01 балла).
Потенциальные области применения этой технологии обширны и включают в себя помощь людям с нарушениями речи, улучшение навигационных систем и создание виртуальных помощников с более естественным звучанием.
- ПодкастAI — это первый подкаст, когда-либо созданный ИИ, в котором пародируется интервью Джо Рогана со Стивом Джобсом. Этот подкаст полностью создан с помощью компьютерных алгоритмов искусственного интеллекта. ИИ был обучен для эпизода со Стивом Джобсом, используя как его биографию, так и любую интернет-запись о нем, которую удалось обнаружить. Это позволило ИИ точно воссоздать его личность.
Читайте больше статей по теме:
Отказ от ответственности
В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.
Об авторе
Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета.
Другие статьиДамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета.