Новостной репортаж Технологии
26 июня 2023

Google представляет AudioPaLM, мощную языковую модель искусственного интеллекта для генерации речи

Коротко

AudioPaLM — мощная языковая модель, разработанная Google который сочетает в себе текстовые и речевые модели для плавной обработки речи и текста.

Он сохраняет паралингвистическую информацию и превосходит существующие системы в задачах перевода речи.

AudioPaLM может переводить языки с акцентом и выполнять передачу голоса для преобразования речи в речь.

Google представила языковую модель под названием АудиоPaLM, который сочетает в себе модели языка на основе текста и речи для беспрепятственной обработки и генерации речи и текста. Объединив возможности ПалМ-2 и АудиоLM, AudioPaLM предлагает унифицированную мультимодальную архитектуру, открывающую широкий спектр приложений, включая распознавание речи и преобразование речи в речь.

Google представляет AudioPaLM, мощную языковую модель для генерации речи
Кредит: Metaverse Post (mpost.ио)

Одной из примечательных особенностей AudioPaLM является его способность сохранять паралингвистическую информацию, такую ​​как личность говорящего и интонация, благодаря влиянию AudioLM. В то же время он использует лингвистические знания, содержащиеся в текстовых языковых моделях, таких как PaLM-2. Инициализируя AudioPaLM с весами модели большого языка, состоящей только из текста, модель превосходно справляется с обработкой речи, используя преимущества обширных данных обучения текста, используемых при предварительном обучении.

Замечательные возможности AudioPaLM были продемонстрированы в ходе различных экспериментов. Он превзошел существующие системы в задачах перевода речи и демонстрирует способность выполнять нулевой выстрел. перевод речи в текст для языков, не встреченных во время обучения.

Кроме того, AudioPaLM обладает функциями звуковые языковые модели путем передачи голосов между языками на основе коротких голосовых подсказок.

Google сделал примеры возможностей AudioPaLM доступны для разведки. Способность модели переводить языки с разными акцентами, такие как итальянский и немецкий, заинтриговала как исследователей, так и пользователей. Кроме того, его умение выполнять передачу голоса для преобразования речи в речь отличает его от существующих базовых показателей, что подтверждается как автоматическими показателями, так и оценщиками.

Модель очень хорошо переводит язык с аудио на аудио на другом языке, сохраняя голос и эмоции человека. Интересно, что при переводе некоторых языков, таких как итальянский и немецкий, модель имеет заметный акцент, а при переводе других, например французского, говорит с идеальным американским акцентом.

Модель AudioPaLM с примерами преобразования речи в речь и автоматического распознавания речи.

Подробнее об ИИ:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Другие статьи
Дамир Ялалов
Дамир Ялалов

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Институциональный аппетит к биткойн-ETF растет на фоне волатильности

Раскрытие информации через отчеты 13F показывает, что известные институциональные инвесторы балуются биткойн-ETF, подчеркивая растущее признание...

Узнать больше

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
MPost Присоединяется к лидерам отрасли в кампании «Биткойн заслуживает смайликов», поддерживая интеграцию символов Биткойна на каждую виртуальную клавиатуру
Образ жизни Новостной репортаж Технологии
MPost Присоединяется к лидерам отрасли в кампании «Биткойн заслуживает смайликов», поддерживая интеграцию символов Биткойна на каждую виртуальную клавиатуру
10 мая 2024
Криптобиржа OKX перечисляет Notcoin и собирается ввести спотовую торговлю парой NOT-USDT 16 мая
Области применения: Новостной репортаж Технологии
Криптобиржа OKX перечисляет Notcoin и собирается ввести спотовую торговлю парой NOT-USDT 16 мая  
10 мая 2024
Blast запускает третье мероприятие по раздаче золота Blast и распределяет 15 миллионов баллов на DApps
Области применения: Новостной репортаж Технологии
Blast запускает третье мероприятие по раздаче золота Blast и распределяет 15 миллионов баллов на DApps
10 мая 2024
Espresso Systems сотрудничает с Polygon Labs для разработки AggLayer для улучшения совместимости накопительных пакетов
Бизнес Новостной репортаж Технологии
Espresso Systems сотрудничает с Polygon Labs для разработки AggLayer для улучшения совместимости накопительных пакетов
9 мая 2024
CRYPTOMERIA LABS PTE. ООО