„Google“ pristato „AudioPaLM“ – galingą AI kalbos modelį, skirtą kalbos generavimui
Trumpai
AudioPaLM yra galingas kalbos modelis, kurį sukūrė "Google" kuri sujungia tekstu ir kalba pagrįstus modelius sklandžiam kalbos ir teksto apdorojimui.
Ji išsaugo paralingvistinę informaciją ir pranoksta esamas sistemas atliekant kalbos vertimo užduotis.
„AudioPaLM“ gali išversti diakritines kalbas ir atlikti balso perkėlimą kalbos vertimui į kalbą.
„Google“ pristatė kalbos modelį, pavadintą AudioPaLM, kuris sujungia tekstu ir kalba pagrįstus kalbos modelius, kad būtų galima sklandžiai apdoroti ir generuoti kalbą ir tekstą. Sujungus galimybes PaLM-2 ir AudioLM, AudioPaLM siūlo vieningą multimodalinę architektūrą, kuri atveria platų programų spektrą, įskaitant kalbos atpažinimą ir kalbos vertimą į kalbą.
Vienas iš svarbiausių „AudioPaLM“ bruožų yra jo gebėjimas išsaugoti paralingvistinę informaciją, tokią kaip kalbėtojo tapatybė ir intonacija, dėl „AudioLM“ įtakos. Tuo pačiu metu jis panaudoja kalbines žinias, randamas teksto kalbos modeliuose, pvz., PaLM-2. Inicijuojus „AudioPaLM“ naudojant tik teksto didelės kalbos modelio svarmenis, modelis puikiai apdoroja kalbą, pasinaudodamas plačiais teksto mokymo duomenimis, naudojamais išankstiniam mokymui.
Nepaprastos AudioPaLM galimybės buvo įrodytos įvairiais eksperimentais. Jis pranoko esamas sistemas kalbos vertimo užduotyse ir demonstruoja galimybę atlikti nulinį kadrą kalbos vertimas į tekstą kalboms, su kuriomis nesusidūrėte mokymų metu.
Be to, „AudioPaLM“ turi funkcijas garso kalbos modeliai perkeliant balsus kitomis kalbomis remiantis trumpais sakytiniais raginimais.
„Google“ sukūrė AudioPaLM galimybių pavyzdžiai galima tyrinėti. Modelio gebėjimas versti kalbas su skirtingais akcentais, pavyzdžiui, italų ir vokiečių, suintrigavo tyrėjus ir vartotojus. Be to, jo gebėjimas atlikti balso perkėlimą kalbos vertimui išskiria jį iš esamų bazinių lygių, ką patvirtina ir automatinės metrikos, ir žmonių vertintojai.
Modelis labai gerai išverčia kalbą iš garso į garso įrašą kita kalba, išsaugodamas žmogaus balsą ir emocijas. Įdomu tai, kad verčiant kai kurias kalbas, pavyzdžiui, italų ir vokiečių, modelis turi pastebimą akcentą, o verčiant kitas, pavyzdžiui, prancūzų, kalba su tobulu amerikietišku akcentu.
Skaitykite daugiau apie AI:
Atsakomybės neigimas
Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.
Apie autorių
Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže.
Daugiau straipsniųDamiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže.