Meta представляет Voicebox, инструмент искусственного интеллекта для преобразования текста в речь
Коротко
Voicebox, последняя инновация Meta, представляет собой революционную систему преобразования текста в речь. инструмент генеративного искусственного интеллекта который преобразует письменный текст в реалистичную речь.
С возможностями, сравнимыми с известными моделями, такими как ChatGPT и Dall-E, Voicebox может выполнять различные задачи генерации речи, такие как редактирование контента, выборка, преобразование стиля, удаление шума, синтез текста в речь и межъязыковая передача стиля.
Voicebox еще не доступен для всех.
Голос окно — это прорыв Meta в области генеративного речевого ИИ, который преобразует текст в реалистичную и выразительную речь. Инструмент AI, который работает аналогично ChatGPT или Dall-E, представляет собой усовершенствованную модель искусственного интеллекта, способную выполнять задачи генерации речи, такие как редактирование контента, выборка и преобразование стиля, даже без специальной подготовки, благодаря обучению в контексте.
Он отличается от других моделей преобразования текста в речь, превосходно справляясь с различными задачами, такими как удаление шума, синтез текста в речь и межъязыковая передача стиля, расширяя границы синтетической генерации речи. Voicebox также превосходит текущие модели по скорости, работая в 20 раз быстрее.
Voicebox прошел обширное обучение с использованием набора данных, включающего более 50,000 XNUMX часов нефильтрованного аудио. Модель ИИ была обучена с использованием инновационной техники Meta «Flow Matching», универсальной альтернативы методам обучения на основе диффузии, используемым в других генеративных моделях.
Набор обучающих данных Meta включает в себя записанную речь и стенограммы общедоступных аудиокниг на нескольких языках, таких как английский, французский, испанский, немецкий, польский и португальский.
По словам Марка Цукерберга, Voicebox — это «первая в истории генеративная речевая модель ИИ, которая может выполнять задачи, для которых она не была специально обучена».
В будущем Voicebox и аналогичные модели искусственного интеллекта смогут обеспечивать естественно звучащие голоса виртуальных помощников и неигровых персонажей в метавселенной. Они также могут позволить людям с нарушениями зрения слышать письменные сообщения знакомыми голосами с помощью ИИ и предлагать создателям простые инструменты для редактирование звуковых дорожек в видео.
Voicebox и опасность дипфейков
Однако Voicebox может создавать некоторые этические и социальные проблемы, особенно в контексте дипфейков. Дипфейки, созданные моделями ИИ, представляют собой синтетические медиа, которые манипулируют голосом человека, часто злонамеренно. Voicebox может создавать убедительные дипфейки, которые имитируют чей-то голос или заставляют их говорить то, чего они никогда не говорили. Это может иметь серьезные последствия для конфиденциальности, безопасности и доверия.
Президент Microsoft Брэд Смит вызывают озабоченность в прошлом месяце о вреде, причиняемом дипфейками. Он подчеркнул необходимость создания механизмов, позволяющих различать подлинные материалы и материалы, созданные искусственным интеллектом, особенно в случаях злого умысла. Он призвал к ответственности и мерам безопасности для сохранения человеческого контроля над критически важной инфраструктурой, управляемой системами ИИ. Кроме того, он предложил систему, в которой разработчики отслеживают использование и обеспечивают прозрачность для выявления манипулируемых видео, аналогично подходу KYC.
Meta утверждает, что осознает потенциальный вред, который может нанести Voicebox, и что компания работает над эффективным способом отличить подлинную речь от звука, генерируемого Voicebox. Хотя Voicebox все еще находится в стадии разработки и в настоящее время не доступен для широкой публики, Meta признает потенциал риски, связанные с передовыми технологиями искусственного интеллекта.
Прочитайте больше:
- VALL-E: новая модель преобразования текста в речь Microsoft с нулевым выстрелом может дублировать голос каждого за три секунды
- Кендрик Ламар только что выпустил музыкальное видео с использованием технологии дипфейка.
- Топ-7 генераторов голоса с искусственным интеллектом и клонирование голоса для преобразования текста в речь
Отказ от ответственности
В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.
Об авторе
Агне — журналист, освещающий последние тенденции и разработки в области метавселенной, искусственного интеллекта и Web3 отрасли для Metaverse Post. Ее страсть к рассказыванию историй побудила ее проводить многочисленные интервью с экспертами в этих областях, всегда стремясь раскрыть захватывающие и увлекательные истории. Агне имеет степень бакалавра литературы и имеет обширный опыт написания статей на самые разные темы, включая путешествия, искусство и культуру. Она также работала волонтером в качестве редактора организации по защите прав животных, где помогала повышать осведомленность о проблемах защиты животных. Свяжитесь с ней по [электронная почта защищена].
Другие статьиАгне — журналист, освещающий последние тенденции и разработки в области метавселенной, искусственного интеллекта и Web3 отрасли для Metaverse Post. Ее страсть к рассказыванию историй побудила ее проводить многочисленные интервью с экспертами в этих областях, всегда стремясь раскрыть захватывающие и увлекательные истории. Агне имеет степень бакалавра литературы и имеет обширный опыт написания статей на самые разные темы, включая путешествия, искусство и культуру. Она также работала волонтером в качестве редактора организации по защите прав животных, где помогала повышать осведомленность о проблемах защиты животных. Свяжитесь с ней по [электронная почта защищена].