Vijesti Tehnologija
Lipnja 26, 2023

Google predstavlja AudioPaLM, moćan AI jezični model za generiranje govora

Ukratko

AudioPaLM je moćan jezični model razvijen od strane Google koji kombinira modele temeljene na tekstu i govoru za besprijekornu obradu govora i teksta.

Čuva paralingvističke informacije i nadmašuje postojeće sustave u zadacima prevođenja govora.

AudioPaLM može prevoditi jezike s naglaskom i izvoditi glasovne prijenose za prevođenje govora u govor.

Google je predstavio jezični model tzv AudioPaLM, koji kombinira jezične modele temeljene na tekstu i govoru za besprijekornu obradu i generiranje govora i teksta. Spajanjem mogućnosti od PaLM-2 i AudioLM, AudioPaLM nudi unificiranu multimodalnu arhitekturu koja otvara širok raspon aplikacija, uključujući prepoznavanje govora i prevođenje govora u govor.

Google predstavlja AudioPaLM, snažan jezični model za generiranje govora
kredit: Metaverse Post (mpost.io)

Jedna značajna značajka AudioPaLM-a je njegova sposobnost očuvanja paralingvističkih informacija poput identiteta govornika i intonacije, zahvaljujući utjecaju AudioLM-a. U isto vrijeme, koristi se lingvističkim znanjem koje se nalazi u tekstualnim jezičnim modelima kao što je PaLM-2. Pokretanjem AudioPaLM-a s težinama velikog jezičnog modela koji se sastoji samo od teksta, model se ističe u obradi govora, iskorištavajući opsežne tekstualne podatke o obuci koji se koriste u prethodnoj obuci.

Izvanredne mogućnosti AudioPaLM-a pokazane su kroz razne pokuse. Nadmašio je postojeće sustave u zadacima prevođenja govora i pokazuje sposobnost izvođenja zero-shot prijevod govora u tekst za jezike s kojima se niste susreli tijekom obuke.

Dodatno, AudioPaLM pokazuje značajke audio jezični modeli prijenosom glasova između jezika na temelju kratkih izgovorenih upita.

Google je napravio primjeri mogućnosti AudioPaLM-a dostupan za istraživanje. Sposobnost modela da prevodi jezike s različitim naglascima, poput talijanskog i njemačkog, zaintrigirala je istraživače i korisnike. Nadalje, njegova stručnost u izvođenju glasovnih prijenosa za prevođenje govora u govor izdvaja ga od postojećih osnovnih linija, što potvrđuju i automatske metrike i ljudski evaluatori.

Model je vrlo dobar u prevođenju jezika iz zvuka u zvuk na drugom jeziku, čuvajući glas i emocije osobe. Zanimljivo, kada prevodi neke jezike poput talijanskog i njemačkog, model ima primjetan naglasak, a kada prevodi druge, na primjer francuski, govori sa savršenim američkim naglaskom.

Model AudioPaLM s primjerima prevođenja govora u govor i automatskog prepoznavanja govora.

Pročitajte više o AI:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Više članaka
Damir Yalalov
Damir Yalalov

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Institucionalni apetit raste prema Bitcoin ETF-ovima usred volatilnosti

Objave putem 13F prijava otkrivaju značajne institucionalne ulagače koji se upuštaju u Bitcoin ETF-ove, naglašavajući sve veće prihvaćanje ...

Znati više

Stiže dan izricanja presude: CZ-ova sudbina visi na ravnoteži dok američki sud razmatra izjavu DOJ-a

Changpeng Zhao danas će se suočiti s kaznom na američkom sudu u Seattleu.

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
Infrastrukturni protokol koji pokreće ZKP ZKBase otkriva plan puta, planira pokretanje testneta u svibnju
Vijesti Tehnologija
Infrastrukturni protokol koji pokreće ZKP ZKBase otkriva plan puta, planira pokretanje testneta u svibnju
Neka 9, 2024
BLOCKCHANCE i CONF3RENCE Ujedinite se za najveće u Njemačkoj Web3 Konferencija u Dortmundu
posao tržišta softver Priče i recenzije Tehnologija
BLOCKCHANCE i CONF3RENCE Ujedinite se za najveće u Njemačkoj Web3 Konferencija u Dortmundu
Neka 9, 2024
NuLink se pokreće na Bybitu Web3 IDO platforma. Faza pretplate produljuje se do 13. svibnja
tržišta Vijesti Tehnologija
NuLink se pokreće na Bybitu Web3 IDO platforma. Faza pretplate produljuje se do 13. svibnja
Neka 9, 2024
UXLINK i Binance surađuju na novoj kampanji, nudeći korisnicima 20 milijuna UXUY bodova i Airdrop Nagrade
tržišta Vijesti Tehnologija
UXLINK i Binance surađuju na novoj kampanji, nudeći korisnicima 20 milijuna UXUY bodova i Airdrop Nagrade
Neka 9, 2024
CRYPTOMERIA LABS PTE. LTD.