VALL-E: Microsofti uus nullkaadri teksti kõneks muutmise mudel suudab kõigi häält kolme sekundiga dubleerida
Põgusalt
Vaid kolmesekundilise mis tahes hääle näidisega, trafopõhine TTS-mudel VALL-E suudab kõnet toota iga häälega.
See on märkimisväärne edasiminek loomulikuma kõlaga TTS-süsteemide suunas.
Microsoft on siiski esitanud mõned näidised kasutatavast mudelist ja on ilmne, et see kujutab endast olulist edasiarendust TTS-tehnoloogias.
Alates esimese teksti kõneks muutmise (TTS) mudeli avaldamisest on teadlased otsinud võimalusi nende süsteemide kõne genereerimise parandamiseks. Microsofti uusim mudel, ORGU, on selles osas märkimisväärne samm edasi.
VALL-E on trafol põhinev TTS-mudel, mis suudab genereerida kõnet mis tahes häälega pärast seda, kui on kuulnud selle hääle kolmesekundilist näidist. See on märkimisväärne edasiminek võrreldes varasemate mudelitega, mis nõudsid uue hääle genereerimiseks palju pikemat koolitusperioodi.
Seotud artikkel: Microsoft on välja andnud difusioonimudeli, mis suudab luua 3D-avatari ühest inimese fotost |
Lisaks säilitatakse genereeritud kõnes hääle intonatsioon, karisma ja stiil. See on oluline samm edasi TTS-süsteemide loomulikuma kõla muutmisel.
See mudel on trafopõhine ja sellel on Dale-1 välimus. Mitte segi ajada difusioonipõhise Dalle-2-ga. Kood on endiselt puudu. Ja kasutajad kahtlevad selle postitamise suhtes.
Microsoft on siiski avaldanud mõned näited mudelist ja on selge, et see on TTS-tehnoloogia suur edasiminek.
Näide #1:
Näide #2:
Näide #3:
Loe AI kohta lähemalt:
Kaebused
Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.
Umbes Autor
Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks.
Veel artikleidDamir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks.