Naujienų ataskaita Technologija
Sausis 08, 2023

VALL-E: „Microsoft“ naujasis nulinio kadro teksto į kalbą modelis gali nukopijuoti kiekvieno balsą per tris sekundes

Trumpai

Tik su trijų sekundžių bet kokio balso pavyzdžiu, transformatoriumi pagrįstas TTS modelis VALL-E gali kalbėti kiekvienu balsu.

Tai reikšminga pažanga natūraliau skambančių TTS sistemų link.

Tačiau „Microsoft“ pateikė kelis naudojamo modelio pavyzdžius, ir akivaizdu, kad tai reiškia reikšmingą TTS technologijos pažangą.

Nuo pirmojo teksto į kalbą (TTS) modelio išleidimo mokslininkai ieško būdų, kaip pagerinti šių sistemų kalbos generavimo būdą. Naujausias „Microsoft“ modelis, SLĖNIS, šiuo atžvilgiu yra svarbus žingsnis į priekį.

VALL-E yra transformatoriumi pagrįstas TTS modelis, kuris gali generuoti kalbą bet kokiu balsu, tik išgirdęs trijų sekundžių to balso pavyzdį. Tai reikšmingas patobulinimas, palyginti su ankstesniais modeliais, kuriems prireikė daug ilgesnio mokymo laikotarpio, kad būtų sukurtas naujas balsas.

VALL-E yra nuostabus technologinis žygdarbis, galintis pakeisti mūsų sąveiką su skaitmenine žiniasklaida.
Susijęs straipsnis: „Microsoft“ išleido difuzijos modelį, kuris gali sukurti 3D avatarą iš vienos asmens nuotraukos

Be to, generuojamoje kalboje nepaliesta balso intonacija, charizma ir stilius. Tai svarbus žingsnis į priekį, kad TTS sistemos skambėtų natūraliau.

Šis modelis yra pagrįstas transformatoriumi ir turi Dale-1 išvaizdą. Negalima painioti su difuzijos pagrindu pagamintu Dalle-2. Kodo dar trūksta. Ir vartotojai skeptiškai vertina tai paskelbdami.

Susijęs straipsnis: Atrodo, kad „Microsoft“ VALL-E yra pati pavojingiausia sukčių programinė įranga

Tačiau „Microsoft“ išleido kelis veikiančio modelio pavyzdžius ir akivaizdu, kad tai yra didelis TTS technologijos pažanga.

#1 Pavyzdys:

Pavyzdys #2:

#3 Pavyzdys:

Skaitykite daugiau apie AI:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Daugiau straipsnių
Damiras Jalalovas
Damiras Jalalovas

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Ateina nuosprendžio paskelbimo diena: CZ likimas subalansuotas, nes JAV teismas svarsto DOJ prašymą

Changpeng Zhao šiandien laukia nuosprendžio JAV teisme Sietle.

Žinoti daugiau

Samourai piniginės įkūrėjai apkaltinti palengvinę 2 mlrd. USD „Darknet“ sandorius

„Samourai Wallet“ įkūrėjų nuogąstavimai yra reikšmingas pramonės nuosmukis, pabrėžiantis nuolatinį ...

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
„Google“ „Med-Gemini“ pasiruošęs duoti pažangą GPT-4 Su puikiu našumu sveikatos priežiūros srityje
AI Wiki Naujienos programinė įranga Technologija
„Google“ „Med-Gemini“ pasiruošęs duoti pažangą GPT-4 Su puikiu našumu sveikatos priežiūros srityje
Gali 2, 2024
Honkongo įstatymų leidžiamosios tarybos narys Wu Jiezhuangas pareiškia civilinį ieškinį prieš JPEX kriptovaliutų biržą
Atsakingas verslas Naujienų ataskaita Technologija
Honkongo įstatymų leidžiamosios tarybos narys Wu Jiezhuangas pareiškia civilinį ieškinį prieš JPEX kriptovaliutų biržą
Gali 2, 2024
„AltLayer“ pradeda antrąjį savo statymo iniciatyvos etapą, pristato „realaus žetoną“.
rinkos Naujienų ataskaita Technologija
„AltLayer“ pradeda antrąjį savo statymo iniciatyvos etapą, pristato „realaus žetoną“.
Gali 2, 2024
BNB tinklo 1 m. pirmojo ketvirčio ataskaitoje pabrėžiama, kad jos vertė sumažėjo 2024 proc., o BSC TVL pakilo 55.8 proc.
rinkos Naujienų ataskaita Technologija
BNB tinklo 1 m. pirmojo ketvirčio ataskaitoje pabrėžiama, kad jos vertė sumažėjo 2024 proc., o BSC TVL pakilo 55.8 proc.
Gali 2, 2024
CRYPTOMERIA LABS PTE. LTD.