VALL-E: Microsoft-un yeni sıfır vuruşlu mətndən nitqə çevirmə modeli üç saniyə ərzində hər kəsin səsini təkrarlaya bilər
Qısaca
İstənilən səsin cəmi üç saniyəlik nümunəsi ilə transformator əsaslı TTS modeli VALL-E hər səsdə nitq yarada bilir.
Bu, daha təbii səslənən TTS sistemləri istiqamətində əhəmiyyətli irəliləyişdir.
Bununla belə, Microsoft istifadə olunan modelin bir neçə nümunəsini təqdim etmişdir və bu, TTS texnologiyasında əhəmiyyətli bir inkişafı təmsil etdiyi aydındır.
İlk mətndən nitqə (TTS) modelinin buraxılmasından bəri tədqiqatçılar bu sistemlərin nitq yaratma üsulunu təkmilləşdirməyin yollarını axtarırlar. Microsoft-dan ən son model, VƏDİ, bu baxımdan irəliyə doğru atılmış mühüm addımdır.
VALL-E transformator əsaslı TTS modelidir və bu səsin yalnız üç saniyəlik nümunəsini eşitdikdən sonra istənilən səsdə nitq yarada bilir. Bu, yeni səs yaratmaq üçün daha uzun təlim müddəti tələb edən əvvəlki modellərlə müqayisədə əhəmiyyətli irəliləyişdir.
Əlaqədar məqalə: “Microsoft” şirkəti insanın tək bir fotosundan 3D avatar yarada bilən diffuziya modeli buraxıb |
Bundan əlavə, səsin intonasiyası, xarizması və üslubu yaradılan nitqdə qorunur. Bu, TTS sistemlərinin daha təbii səslənməsi üçün irəliyə doğru atılmış mühüm addımdır.
Bu model transformator əsaslıdır və Dale-1 görünüşünə malikdir. Diffuziya əsaslı Dalle-2 ilə qarışdırılmamalıdır. Kod hələ də çatışmır. İstifadəçilər isə onu yerləşdirəcəklərinə şübhə ilə yanaşırlar.
Bununla belə, Microsoft fəaliyyətdə olan modelin bir neçə nümunəsini yayımladı və bunun TTS texnologiyasında böyük irəliləyiş olduğu aydındır.
Misal #1:
Nümunə #2:
Misal #3:
AI haqqında daha çox oxuyun:
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.
Ətraflı məqalələrDamir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.