Google predstavlja AudioPaLM, moćan AI jezični model za generiranje govora
Ukratko
AudioPaLM je moćan jezični model razvijen od strane Google koji kombinira modele temeljene na tekstu i govoru za besprijekornu obradu govora i teksta.
Čuva paralingvističke informacije i nadmašuje postojeće sustave u zadacima prevođenja govora.
AudioPaLM može prevoditi jezike s naglaskom i izvoditi glasovne prijenose za prevođenje govora u govor.
Google je predstavio jezični model tzv AudioPaLM, koji kombinira jezične modele temeljene na tekstu i govoru za besprijekornu obradu i generiranje govora i teksta. Spajanjem mogućnosti od PaLM-2 i AudioLM, AudioPaLM nudi unificiranu multimodalnu arhitekturu koja otvara širok raspon aplikacija, uključujući prepoznavanje govora i prevođenje govora u govor.
Jedna značajna značajka AudioPaLM-a je njegova sposobnost očuvanja paralingvističkih informacija poput identiteta govornika i intonacije, zahvaljujući utjecaju AudioLM-a. U isto vrijeme, koristi se lingvističkim znanjem koje se nalazi u tekstualnim jezičnim modelima kao što je PaLM-2. Pokretanjem AudioPaLM-a s težinama velikog jezičnog modela koji se sastoji samo od teksta, model se ističe u obradi govora, iskorištavajući opsežne tekstualne podatke o obuci koji se koriste u prethodnoj obuci.
Izvanredne mogućnosti AudioPaLM-a pokazane su kroz razne pokuse. Nadmašio je postojeće sustave u zadacima prevođenja govora i pokazuje sposobnost izvođenja zero-shot prijevod govora u tekst za jezike s kojima se niste susreli tijekom obuke.
Dodatno, AudioPaLM pokazuje značajke audio jezični modeli prijenosom glasova između jezika na temelju kratkih izgovorenih upita.
Google je napravio primjeri mogućnosti AudioPaLM-a dostupan za istraživanje. Sposobnost modela da prevodi jezike s različitim naglascima, poput talijanskog i njemačkog, zaintrigirala je istraživače i korisnike. Nadalje, njegova stručnost u izvođenju glasovnih prijenosa za prevođenje govora u govor izdvaja ga od postojećih osnovnih linija, što potvrđuju i automatske metrike i ljudski evaluatori.
Model je vrlo dobar u prevođenju jezika iz zvuka u zvuk na drugom jeziku, čuvajući glas i emocije osobe. Zanimljivo, kada prevodi neke jezike poput talijanskog i njemačkog, model ima primjetan naglasak, a kada prevodi druge, na primjer francuski, govori sa savršenim američkim naglaskom.
Pročitajte više o AI:
Izjava o odricanju od odgovornosti
U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.
O autoru
Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.
Više članakaDamir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.