Новински извештај технологија
Јун 26, 2023

Гоогле представља АудиоПаЛМ, моћан АИ језички модел за генерисање говора

Укратко

АудиоПаЛМ је моћан језички модел који је развио гоогле који комбинује моделе засноване на тексту и говору за беспрекорну обраду говора и текста.

Чува паралингвистичке информације и надмашује постојеће системе у задацима превођења говора.

АудиоПаЛМ може да преводи језике са акцентима и да врши пренос гласа за превод говора у говор.

Гугл је представио језички модел тзв АудиоПаЛМ, који комбинује моделе језика засноване на тексту и говору за беспрекорну обраду и генерисање говора и текста. Спајањем способности од ПаЛМ-2 АудиоЛМ, АудиоПаЛМ нуди јединствену мултимодалну архитектуру која отвара широк спектар апликација, укључујући препознавање говора и превод говора у говор.

Гоогле представља АудиоПаЛМ, моћан језички модел за генерисање говора
Кредит: Metaverse Post (mpost.ио)

Једна значајна карактеристика АудиоПаЛМ-а је његова способност да сачува паралингвистичке информације као што су идентитет говорника и интонација, захваљујући утицају АудиоЛМ-а. Истовремено, користи лингвистичко знање које се налази у моделима језика заснованим на тексту као што је ПаЛМ-2. Иницијализацијом АудиоПаЛМ-а са тежинама великог језичког модела који садржи само текст, модел се истиче у обради говора, користећи предности обимних података за обуку текста који се користе у претренингу.

Изузетне могућности АудиоПаЛМ-а су демонстриране кроз разне експерименте. Надмашио је постојеће системе у задацима превођења говора и показује способност да се изврши нула снимака превод говора у текст за језике који се не сусрећу током обуке.

Поред тога, АудиоПаЛМ има карактеристике модели аудио језика преносом гласова преко језика на основу кратких изговорених упутстава.

Гоогле је направио примери могућности АудиоПаЛМ-а доступан за истраживање. Способност модела да преводи језике са различитим акцентима, као што су италијански и немачки, заинтригирала је и истраживаче и кориснике. Штавише, његова стручност у извођењу преноса гласа за превод говора у говор га издваја од постојећих основних линија, што потврђују и аутоматске метрике и људски евалуатори.

Модел је веома добар у превођењу језика са аудио на аудио на другом језику, чувајући глас и емоције особе. Занимљиво, када преводите неке језике попут италијанског и немачког, модел има приметан акценат, а када преводи друге, на пример, француски, говори са савршеним америчким акцентом.

АудиоПаЛМ модел са примерима превода говора у говор и аутоматским препознавањем говора.

Прочитајте више о АИ:

Одрицање од одговорности

У складу са Смернице пројекта Труст, имајте на уму да информације дате на овој страници нису намењене и не треба да се тумаче као правни, порески, инвестициони, финансијски или било који други облик савета. Важно је да инвестирате само оно што можете приуштити да изгубите и да тражите независан финансијски савет ако сумњате. За додатне информације, предлажемо да погледате одредбе и услове, као и странице помоћи и подршке које пружа издавач или оглашивач. MetaversePost је посвећен тачном, непристрасном извештавању, али тржишни услови су подложни променама без претходне најаве.

О аутору

Дамир је вођа тима, менаџер производа и уредник у Metaverse Post, покривајући теме као што су АИ/МЛ, АГИ, ЛЛМ, Метаверсе и Web3-сродна поља. Његови чланци привлаче огромну публику од преко милион корисника сваког месеца. Чини се да је стручњак са 10 година искуства у СЕО и дигиталном маркетингу. Дамир се помиње у Масхабле, Виред, Cointelegraph, Тхе Нев Иоркер, Инсиде.цом, Ентрепренеур, БеИнЦрипто и друге публикације. Путује између УАЕ, Турске, Русије и ЗНД као дигитални номад. Дамир је стекао диплому физике, за коју верује да му је дало вештине критичког размишљања које су му потребне да буде успешан у свету интернета који се стално мења. 

više чланака
Дамир Иалалов
Дамир Иалалов

Дамир је вођа тима, менаџер производа и уредник у Metaverse Post, покривајући теме као што су АИ/МЛ, АГИ, ЛЛМ, Метаверсе и Web3-сродна поља. Његови чланци привлаче огромну публику од преко милион корисника сваког месеца. Чини се да је стручњак са 10 година искуства у СЕО и дигиталном маркетингу. Дамир се помиње у Масхабле, Виред, Cointelegraph, Тхе Нев Иоркер, Инсиде.цом, Ентрепренеур, БеИнЦрипто и друге публикације. Путује између УАЕ, Турске, Русије и ЗНД као дигитални номад. Дамир је стекао диплому физике, за коју верује да му је дало вештине критичког размишљања које су му потребне да буде успешан у свету интернета који се стално мења. 

Hot Stories
Придружите се нашем билтену.
Најновије вести

Институционални апетит расте према Битцоин ЕТФ-овима усред волатилности

Откривања путем 13Ф поднесака откривају значајне институционалне инвеститоре који се баве Битцоин ЕТФ-овима, наглашавајући све веће прихватање ...

Знате више

Стиже дан изрицања пресуде: Судбина ЦЗ-а виси у равнотежи док амерички суд разматра изјашњење Министарства правде

Цхангпенг Зхао се данас суочава са изрицањем казне на америчком суду у Сијетлу.

Знате више
Придружите се нашој заједници иновативних технологија
Опширније
opširnije
Инфраструктурни протокол који покреће ЗКП ЗКБасе открива мапу пута, планира лансирање тестне мреже у мају
Новински извештај технологија
Инфраструктурни протокол који покреће ЗКП ЗКБасе открива мапу пута, планира лансирање тестне мреже у мају
Може 9, 2024
БЛОЦКЦХАНЦЕ и ЦОНФ3РЕНЦЕ се уједињују за највећу Немачку Web3 Конференција у Дортмунду
Posao tržišta софтвер Приче и критике технологија
БЛОЦКЦХАНЦЕ и ЦОНФ3РЕНЦЕ се уједињују за највећу Немачку Web3 Конференција у Дортмунду
Може 9, 2024
НуЛинк лансира на Бибит Web3 ИДО платформа. Фаза претплате се продужава до 13. маја
tržišta Новински извештај технологија
НуЛинк лансира на Бибит Web3 ИДО платформа. Фаза претплате се продужава до 13. маја
Може 9, 2024
УКСЛИНК и Бинанце сарађују на новој кампањи, нудећи корисницима 20 милиона УКСУИ поена и Airdrop Награде
tržišta Новински извештај технологија
УКСЛИНК и Бинанце сарађују на новој кампањи, нудећи корисницима 20 милиона УКСУИ поена и Airdrop Награде
Може 9, 2024
ЦРИПТОМЕРИА ЛАБС ПТЕ. ЛТД.