Buletin de stiri Tehnologia
26 Iunie, 2023

Google introduce AudioPaLM, un model puternic de limbaj AI pentru generarea vorbirii

Pe scurt

AudioPaLM este un model de limbaj puternic dezvoltat de Google care combină modele bazate pe text și modele bazate pe vorbire pentru vorbire și procesare a textului fără întreruperi.

Păstrează informațiile paralingvistice și depășește sistemele existente în sarcinile de traducere a vorbirii.

AudioPaLM poate traduce limbi cu accent și poate efectua transferuri vocale pentru traducerea de la vorbire la vorbire.

Google a dezvăluit un model de limbă numit AudioPaLM, care combină modele de limbaj bazate pe text și vorbire pentru a procesa și a genera vorbirea și textul fără probleme. Prin îmbinarea capacităților de PaLM-2 și AudioLM, AudioPaLM oferă o arhitectură multimodală unificată care deschide o gamă largă de aplicații, inclusiv recunoașterea vorbirii și traducerea de la vorbire la vorbire.

Google introduce AudioPaLM, un model de limbaj puternic pentru generarea vorbirii
Credit: Metaverse Post (mpost.io)

O caracteristică notabilă a AudioPaLM este capacitatea sa de a păstra informații paralingvistice, cum ar fi identitatea vorbitorului și intonația, datorită influenței AudioLM. În același timp, valorifică cunoștințele lingvistice găsite în modelele de limbaj bazate pe text precum PaLM-2. Prin inițializarea AudioPaLM cu greutățile unui model de limbă mare, doar text, modelul excelează în procesarea vorbirii, profitând de datele extinse de antrenament de text utilizate în preinstruire.

Capacitățile remarcabile ale AudioPaLM au fost demonstrate prin diferite experimente. A depășit sistemele existente în sarcinile de traducere a vorbirii și demonstrează capacitatea de a efectua zero-shot traducere din vorbire în text pentru limbile care nu sunt întâlnite în timpul instruirii.

În plus, AudioPaLM prezintă caracteristici ale modele de limbaj audio prin transferul de voci în diferite limbi pe baza unor solicitări scurte vorbite.

Google a făcut exemple de capabilități AudioPaLM disponibil pentru explorare. Capacitatea modelului de a traduce limbi cu accente distincte, cum ar fi italiana și germana, a intrigat cercetătorii și utilizatorii deopotrivă. În plus, competența sa în efectuarea de transferuri vocale pentru traducerea de la vorbire la vorbire îl diferențiază de liniile de bază existente, după cum confirmă atât metricile automate, cât și evaluatorii umani.

Modelul este foarte bun la traducerea unei limbi din audio în audio într-o altă limbă, păstrând vocea și emoțiile unei persoane. Interesant este că atunci când traduceți unele limbi precum italiană și germană, modelul are un accent vizibil, iar atunci când traduceți altele, de exemplu, franceză, vorbește cu un accent american perfect.

Modelul AudioPaLM cu exemple de traducere de la vorbire la vorbire și recunoaștere automată a vorbirii.

Citiți mai multe despre AI:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Mai multe articole
Damir Yalalov
Damir Yalalov

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Apetitul instituțional crește față de ETF-urile Bitcoin pe fondul volatilității

Dezvăluirile prin dosarele 13F dezvăluie investitori instituționali de seamă care se amestecă în ETF-uri Bitcoin, subliniind o acceptare tot mai mare a...

Aflați mai multe

Sosește ziua sentinței: soarta lui CZ este în echilibru, în timp ce tribunalul american ia în considerare pledoaria DOJ

Changpeng Zhao este pe cale de a fi condamnat astăzi într-un tribunal american din Seattle.

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Protocolul de infrastructură alimentat de ZKP ZKBase dezvăluie foaia de parcurs și plănuiește lansarea Testnetului în mai
Buletin de stiri Tehnologia
Protocolul de infrastructură alimentat de ZKP ZKBase dezvăluie foaia de parcurs și plănuiește lansarea Testnetului în mai
9 Mai, 2024
BLOCKCHANCE și CONF3RENCE se unesc pentru cel mai mare din Germania Web3 Conferință la Dortmund
Afaceri pieţe Software Povești și recenzii Tehnologia
BLOCKCHANCE și CONF3RENCE se unesc pentru cel mai mare din Germania Web3 Conferință la Dortmund
9 Mai, 2024
NuLink se lansează pe Bybit Web3 Platforma IDO. Faza de abonament se prelungește până pe 13 mai
pieţe Buletin de stiri Tehnologia
NuLink se lansează pe Bybit Web3 Platforma IDO. Faza de abonament se prelungește până pe 13 mai
9 Mai, 2024
UXLINK și Binance colaborează la o nouă campanie, oferind utilizatorilor 20 de milioane de puncte UXUY și Airdrop Recompense
pieţe Buletin de stiri Tehnologia
UXLINK și Binance colaborează la o nouă campanie, oferind utilizatorilor 20 de milioane de puncte UXUY și Airdrop Recompense
9 Mai, 2024
CRYPTOMERIA LABS PTE. LTD.