Novinová správa Technológia
Júna 26, 2023

Google predstavuje AudioPaLM, výkonný jazykový model AI na generovanie reči

Stručne

AudioPaLM je výkonný jazykový model vyvinutý spoločnosťou Google ktorý kombinuje textové a rečové modely pre bezproblémové spracovanie reči a textu.

Zachováva paralingvistické informácie a prekonáva existujúce systémy v úlohách prekladu reči.

AudioPaLM dokáže prekladať jazyky s diakritikou a vykonávať hlasové prenosy na preklad reči do reči.

Google predstavil jazykový model tzv AudioPaLM, ktorá kombinuje jazykové modely založené na texte a reči na bezproblémové spracovanie a generovanie reči a textu. Zlúčením schopností o PaLM-2 a AudioLM, AudioPaLM ponúka jednotnú multimodálnu architektúru, ktorá otvára široké spektrum aplikácií vrátane rozpoznávania reči a prekladu reči do reči.

Google predstavuje AudioPaLM, výkonný jazykový model na generovanie reči
kredit: Metaverse Post (mpost.io)

Jednou z pozoruhodných vlastností AudioPaLM je jeho schopnosť zachovať paralingvistické informácie, ako je identita rečníka a intonácia, vďaka vplyvu AudioLM. Zároveň využíva lingvistické znalosti nachádzajúce sa v textových jazykových modeloch, ako je PaLM-2. Inicializáciou AudioPaLM s váhami len textového modelu veľkého jazyka model vyniká v spracovaní reči, pričom využíva rozsiahle textové trénovacie dáta používané pri predtrénovaní.

Pozoruhodné schopnosti AudioPaLM boli demonštrované prostredníctvom rôznych experimentov. Prekonal existujúce systémy v úlohách prekladu reči a predvádza schopnosť vykonávať zero-shot preklad z reči do textu pre jazyky, s ktorými sa počas školenia nestretnete.

Okrem toho AudioPaLM vykazuje funkcie audio jazykové modely prenosom hlasov medzi jazykmi na základe krátkych hovorených výziev.

Google urobil príklady možností AudioPaLM k dispozícii na prieskum. Schopnosť modelu prekladať jazyky s odlišnými prízvukmi, ako je taliančina a nemčina, zaujala výskumníkov aj používateľov. Okrem toho, jeho odbornosť pri vykonávaní hlasových prenosov na preklad z reči do reči ho odlišuje od existujúcich základných línií, čo potvrdzujú automatické metriky aj ľudskí hodnotitelia.

Model je veľmi dobrý pri preklade jazyka zo zvuku do zvuku v inom jazyku, pričom zachováva hlas a emócie človeka. Zaujímavé je, že pri preklade niektorých jazykov, ako je taliančina a nemčina, má model výrazný prízvuk a pri preklade iných, napríklad francúzštiny, hovorí s perfektným americkým prízvukom.

Model AudioPaLM s príkladmi prekladu reči do reči a automatického rozpoznávania reči.

Prečítajte si viac o AI:

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Ďalšie články
Damir Yalalov
Damir Yalalov

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Hot Stories
Pridajte sa k nášmu newsletteru.
Novinky

Inštitucionálny apetít rastie smerom k bitcoinovým ETF uprostred volatility

Zverejnenia prostredníctvom podaní 13F odhaľujú pozoruhodných inštitucionálnych investorov, ktorí sa venujú bitcoinovým ETF, čo podčiarkuje rastúcu akceptáciu ...

vedieť viac

Prichádza deň odsúdenia: Osud CZ visí v rovnováhe, pretože americký súd zvažuje žalobu ministerstva spravodlivosti

Changpeng Zhao dnes čaká na americkom súde v Seattli odsúdenie.

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
MPost Pripojte sa k lídrom v odvetví v kampani „Bitcoin si zaslúži Emoji“, ktorá podporuje integráciu symbolov bitcoínov na každej virtuálnej klávesnici
Životný štýl Novinová správa Technológia
MPost Pripojte sa k lídrom v odvetví v kampani „Bitcoin si zaslúži Emoji“, ktorá podporuje integráciu symbolov bitcoínov na každej virtuálnej klávesnici
Môže 10, 2024
Crypto Exchange OKX uvádza notcoiny, pričom 16. mája zavedie spotové obchodovanie s párom NOT-USDT
trhy Novinová správa Technológia
Crypto Exchange OKX uvádza notcoiny, pričom 16. mája zavedie spotové obchodovanie s párom NOT-USDT  
Môže 10, 2024
Blast spúšťa tretiu udalosť distribúcie zlata Blast, prideľuje 15 miliónov bodov DApps
trhy Novinová správa Technológia
Blast spúšťa tretiu udalosť distribúcie zlata Blast, prideľuje 15 miliónov bodov DApps
Môže 10, 2024
Espresso Systems spolupracuje s polygonovými laboratóriami na vývoji AggLayer pre zlepšenie súhrnnej interoperability
firmy Novinová správa Technológia
Espresso Systems spolupracuje s polygonovými laboratóriami na vývoji AggLayer pre zlepšenie súhrnnej interoperability
Môže 9, 2024
CRYPTOMERIA LABS PTE. LTD.