Naujienų ataskaita Technologija
Birželio 26, 2023

„Google“ pristato „AudioPaLM“ – galingą AI kalbos modelį, skirtą kalbos generavimui

Trumpai

AudioPaLM yra galingas kalbos modelis, kurį sukūrė "Google" kuri sujungia tekstu ir kalba pagrįstus modelius sklandžiam kalbos ir teksto apdorojimui.

Ji išsaugo paralingvistinę informaciją ir pranoksta esamas sistemas atliekant kalbos vertimo užduotis.

„AudioPaLM“ gali išversti diakritines kalbas ir atlikti balso perkėlimą kalbos vertimui į kalbą.

„Google“ pristatė kalbos modelį, pavadintą AudioPaLM, kuris sujungia tekstu ir kalba pagrįstus kalbos modelius, kad būtų galima sklandžiai apdoroti ir generuoti kalbą ir tekstą. Sujungus galimybes PaLM-2 ir AudioLM, AudioPaLM siūlo vieningą multimodalinę architektūrą, kuri atveria platų programų spektrą, įskaitant kalbos atpažinimą ir kalbos vertimą į kalbą.

„Google“ pristato „AudioPaLM“ – galingą kalbos modelį, skirtą kalbos generavimui
Kreditas: Metaverse Post (mpost.io)

Vienas iš svarbiausių „AudioPaLM“ bruožų yra jo gebėjimas išsaugoti paralingvistinę informaciją, tokią kaip kalbėtojo tapatybė ir intonacija, dėl „AudioLM“ įtakos. Tuo pačiu metu jis panaudoja kalbines žinias, randamas teksto kalbos modeliuose, pvz., PaLM-2. Inicijuojus „AudioPaLM“ naudojant tik teksto didelės kalbos modelio svarmenis, modelis puikiai apdoroja kalbą, pasinaudodamas plačiais teksto mokymo duomenimis, naudojamais išankstiniam mokymui.

Nepaprastos AudioPaLM galimybės buvo įrodytos įvairiais eksperimentais. Jis pranoko esamas sistemas kalbos vertimo užduotyse ir demonstruoja galimybę atlikti nulinį kadrą kalbos vertimas į tekstą kalboms, su kuriomis nesusidūrėte mokymų metu.

Be to, „AudioPaLM“ turi funkcijas garso kalbos modeliai perkeliant balsus kitomis kalbomis remiantis trumpais sakytiniais raginimais.

„Google“ sukūrė AudioPaLM galimybių pavyzdžiai galima tyrinėti. Modelio gebėjimas versti kalbas su skirtingais akcentais, pavyzdžiui, italų ir vokiečių, suintrigavo tyrėjus ir vartotojus. Be to, jo gebėjimas atlikti balso perkėlimą kalbos vertimui išskiria jį iš esamų bazinių lygių, ką patvirtina ir automatinės metrikos, ir žmonių vertintojai.

Modelis labai gerai išverčia kalbą iš garso į garso įrašą kita kalba, išsaugodamas žmogaus balsą ir emocijas. Įdomu tai, kad verčiant kai kurias kalbas, pavyzdžiui, italų ir vokiečių, modelis turi pastebimą akcentą, o verčiant kitas, pavyzdžiui, prancūzų, kalba su tobulu amerikietišku akcentu.

AudioPaLM modelis su kalbos vertimo į kalbą ir automatinio kalbos atpažinimo pavyzdžiais.

Skaitykite daugiau apie AI:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Daugiau straipsnių
Damiras Jalalovas
Damiras Jalalovas

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Hot Stories
Prisijunkite prie mūsų naujienlaiškio.
Paskutinės naujienos

Institucinis apetitas Bitcoin ETF atžvilgiu auga dėl nepastovumo

13F paraiškų atskleidimas atskleidžia žymius institucinius investuotojus, kurie naudojasi Bitcoin ETF, o tai rodo, kad vis labiau pritariama...

Žinoti daugiau

Ateina nuosprendžio paskelbimo diena: CZ likimas subalansuotas, nes JAV teismas svarsto DOJ prašymą

Changpeng Zhao šiandien laukia nuosprendžio JAV teisme Sietle.

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
MPost Prisijungia prie pramonės lyderių kampanijoje „Bitcoin nusipelno jaustukų“, palaikydama Bitcoin simbolių integraciją kiekvienoje virtualioje klaviatūroje
Gyvenimo būdas Naujienų ataskaita Technologija
MPost Prisijungia prie pramonės lyderių kampanijoje „Bitcoin nusipelno jaustukų“, palaikydama Bitcoin simbolių integraciją kiekvienoje virtualioje klaviatūroje
Gali 10, 2024
Kriptovaliutų birža OKX įtraukė į „Notcoin“ sąrašą, gegužės 16 d.
rinkos Naujienų ataskaita Technologija
Kriptovaliutų birža OKX įtraukė į „Notcoin“ sąrašą, gegužės 16 d.  
Gali 10, 2024
„Blast“ pradeda trečiąjį „Blast Gold“ platinimo renginį, skiria 15 mln. taškų „DApps“
rinkos Naujienų ataskaita Technologija
„Blast“ pradeda trečiąjį „Blast Gold“ platinimo renginį, skiria 15 mln. taškų „DApps“
Gali 10, 2024
„Espresso Systems“ bendradarbiauja su „Polygon Labs“, kad sukurtų „AggLayer“, kad pagerintų sudėtinio suderinamumą
Atsakingas verslas Naujienų ataskaita Technologija
„Espresso Systems“ bendradarbiauja su „Polygon Labs“, kad sukurtų „AggLayer“, kad pagerintų sudėtinio suderinamumą
Gali 9, 2024
CRYPTOMERIA LABS PTE. LTD.