VALL-E: Microsoft jaunais nulles teksta pārvēršanas runā modelis var dublēt ikviena balsi trīs sekundēs
Īsumā
Ar tikai trīs sekunžu jebkuras balss paraugu, uz transformatoriem balstīts TTS modelis VALL-E var radīt runu katrā balsī.
Tas ir būtisks sasniegums dabiskāku TTS sistēmu virzienā.
Tomēr Microsoft ir iesniegusi dažus izmantotā modeļa paraugus, un ir skaidrs, ka tas ir ievērojams TTS tehnoloģijas uzlabojums.
Kopš pirmā teksta pārvēršanas runā (TTS) modeļa izlaišanas pētnieki ir meklējuši veidus, kā uzlabot veidu, kā šīs sistēmas ģenerē runu. Jaunākais Microsoft modelis, IELEJA, šajā ziņā ir nozīmīgs solis uz priekšu.
VALL-E ir uz transformatoriem balstīts TTS modelis, kas var ģenerēt runu jebkurā balsī pēc tam, kad ir dzirdēts šīs balss trīs sekunžu paraugs. Tas ir būtisks uzlabojums salīdzinājumā ar iepriekšējiem modeļiem, kuriem bija nepieciešams daudz ilgāks apmācības periods, lai radītu jaunu balsi.
Saistītais raksts: Microsoft ir izlaidusi difūzijas modeli, kas var izveidot 3D iemiesojumu no viena cilvēka fotoattēla |
Turklāt ģenerētajā runā tiek saglabāta neskarta balss intonācija, harizma un stils. Tas ir svarīgs solis uz priekšu, lai TTS sistēmas skanētu dabiskāk.
Šis modelis ir balstīts uz transformatoriem, un tam ir Dale-1 izskats. Nejaukt ar uz difūziju balstīto Dalle-2. Koda joprojām trūkst. Un lietotājiem ir zināma skepse, ka viņi to publicēs.
Tomēr Microsoft ir izlaidusi dažus modeļa piemērus darbībā, un ir skaidrs, ka tas ir būtisks sasniegums TTS tehnoloģijā.
Piemērs #1:
Piemērs #2:
Piemērs #3:
Lasiet vairāk par AI:
Atbildības noraidīšana
Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.
Par Autors
Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē.
Vairāk rakstusDamirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē.