Новостной репортаж СМЗ Технологии
19 июня 2023

Meta представляет Voicebox, инструмент искусственного интеллекта для преобразования текста в речь

Коротко

Voicebox, последняя инновация Meta, представляет собой революционную систему преобразования текста в речь. инструмент генеративного искусственного интеллекта который преобразует письменный текст в реалистичную речь.

С возможностями, сравнимыми с известными моделями, такими как ChatGPT и Dall-E, Voicebox может выполнять различные задачи генерации речи, такие как редактирование контента, выборка, преобразование стиля, удаление шума, синтез текста в речь и межъязыковая передача стиля.

Voicebox еще не доступен для всех.

Голос окно — это прорыв Meta в области генеративного речевого ИИ, который преобразует текст в реалистичную и выразительную речь. Инструмент AI, который работает аналогично ChatGPT или Dall-E, представляет собой усовершенствованную модель искусственного интеллекта, способную выполнять задачи генерации речи, такие как редактирование контента, выборка и преобразование стиля, даже без специальной подготовки, благодаря обучению в контексте. 

Meta представляет Voicebox, инструмент искусственного интеллекта для преобразования текста в речь

Он отличается от других моделей преобразования текста в речь, превосходно справляясь с различными задачами, такими как удаление шума, синтез текста в речь и межъязыковая передача стиля, расширяя границы синтетической генерации речи. Voicebox также превосходит текущие модели по скорости, работая в 20 раз быстрее.

Voicebox прошел обширное обучение с использованием набора данных, включающего более 50,000 XNUMX часов нефильтрованного аудио. Модель ИИ была обучена с использованием инновационной техники Meta «Flow Matching», универсальной альтернативы методам обучения на основе диффузии, используемым в других генеративных моделях. 

Набор обучающих данных Meta включает в себя записанную речь и стенограммы общедоступных аудиокниг на нескольких языках, таких как английский, французский, испанский, немецкий, польский и португальский.

По словам Марка Цукерберга, Voicebox — это «первая в истории генеративная речевая модель ИИ, которая может выполнять задачи, для которых она не была специально обучена».

Источник: Марк Цукерберг.

В будущем Voicebox и аналогичные модели искусственного интеллекта смогут обеспечивать естественно звучащие голоса виртуальных помощников и неигровых персонажей в метавселенной. Они также могут позволить людям с нарушениями зрения слышать письменные сообщения знакомыми голосами с помощью ИИ и предлагать создателям простые инструменты для редактирование звуковых дорожек в видео.

Voicebox и опасность дипфейков

Однако Voicebox может создавать некоторые этические и социальные проблемы, особенно в контексте дипфейков. Дипфейки, созданные моделями ИИ, представляют собой синтетические медиа, которые манипулируют голосом человека, часто злонамеренно. Voicebox может создавать убедительные дипфейки, которые имитируют чей-то голос или заставляют их говорить то, чего они никогда не говорили. Это может иметь серьезные последствия для конфиденциальности, безопасности и доверия.

Президент Microsoft Брэд Смит вызывают озабоченность в прошлом месяце о вреде, причиняемом дипфейками. Он подчеркнул необходимость создания механизмов, позволяющих различать подлинные материалы и материалы, созданные искусственным интеллектом, особенно в случаях злого умысла. Он призвал к ответственности и мерам безопасности для сохранения человеческого контроля над критически важной инфраструктурой, управляемой системами ИИ. Кроме того, он предложил систему, в которой разработчики отслеживают использование и обеспечивают прозрачность для выявления манипулируемых видео, аналогично подходу KYC.

Meta утверждает, что осознает потенциальный вред, который может нанести Voicebox, и что компания работает над эффективным способом отличить подлинную речь от звука, генерируемого Voicebox. Хотя Voicebox все еще находится в стадии разработки и в настоящее время не доступен для широкой публики, Meta признает потенциал риски, связанные с передовыми технологиями искусственного интеллекта.

Прочитайте больше:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Агне — журналист, освещающий последние тенденции и разработки в области метавселенной, искусственного интеллекта и Web3 отрасли для Metaverse Post. Ее страсть к рассказыванию историй побудила ее проводить многочисленные интервью с экспертами в этих областях, всегда стремясь раскрыть захватывающие и увлекательные истории. Агне имеет степень бакалавра литературы и имеет обширный опыт написания статей на самые разные темы, включая путешествия, искусство и культуру. Она также работала волонтером в качестве редактора организации по защите прав животных, где помогала повышать осведомленность о проблемах защиты животных. Свяжитесь с ней по [электронная почта защищена].

Другие статьи
Агне Цимерман
Агне Цимерман

Агне — журналист, освещающий последние тенденции и разработки в области метавселенной, искусственного интеллекта и Web3 отрасли для Metaverse Post. Ее страсть к рассказыванию историй побудила ее проводить многочисленные интервью с экспертами в этих областях, всегда стремясь раскрыть захватывающие и увлекательные истории. Агне имеет степень бакалавра литературы и имеет обширный опыт написания статей на самые разные темы, включая путешествия, искусство и культуру. Она также работала волонтером в качестве редактора организации по защите прав животных, где помогала повышать осведомленность о проблемах защиты животных. Свяжитесь с ней по [электронная почта защищена].

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Институциональный аппетит к биткойн-ETF растет на фоне волатильности

Раскрытие информации через отчеты 13F показывает, что известные институциональные инвесторы балуются биткойн-ETF, подчеркивая растущее признание...

Узнать больше

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Injective объединяет усилия с AltLayer, чтобы внести изменения в безопасность в inEVM
Бизнес Новостной репортаж Технологии
Injective объединяет усилия с AltLayer, чтобы внести изменения в безопасность в inEVM
3 мая 2024
Masa объединяется с Teller, чтобы представить кредитный пул MASA, позволяющий заимствовать USDC на базе
Области применения: Новостной репортаж Технологии
Masa объединяется с Teller, чтобы представить кредитный пул MASA, позволяющий заимствовать USDC на базе
3 мая 2024
Velodrome запускает бета-версию Superchain в ближайшие недели и распространяется на блокчейны второго уровня стека OP
Области применения: Новостной репортаж Технологии
Velodrome запускает бета-версию Superchain в ближайшие недели и распространяется на блокчейны второго уровня стека OP
3 мая 2024
CARV объявляет о партнерстве с Aethir для децентрализации уровня данных и распределения вознаграждений
Бизнес Новостной репортаж Технологии
CARV объявляет о партнерстве с Aethir для децентрализации уровня данных и распределения вознаграждений
3 мая 2024
CRYPTOMERIA LABS PTE. ООО