Xəbər Hesabatı Texnologiya
Yanvar 08, 2023

VALL-E: Microsoft-un yeni sıfır vuruşlu mətndən nitqə çevirmə modeli üç saniyə ərzində hər kəsin səsini təkrarlaya bilər

Qısaca

İstənilən səsin cəmi üç saniyəlik nümunəsi ilə transformator əsaslı TTS modeli VALL-E hər səsdə nitq yarada bilir.

Bu, daha təbii səslənən TTS sistemləri istiqamətində əhəmiyyətli irəliləyişdir.

Bununla belə, Microsoft istifadə olunan modelin bir neçə nümunəsini təqdim etmişdir və bu, TTS texnologiyasında əhəmiyyətli bir inkişafı təmsil etdiyi aydındır.

İlk mətndən nitqə (TTS) modelinin buraxılmasından bəri tədqiqatçılar bu sistemlərin nitq yaratma üsulunu təkmilləşdirməyin yollarını axtarırlar. Microsoft-dan ən son model, VƏDİ, bu baxımdan irəliyə doğru atılmış mühüm addımdır.

VALL-E transformator əsaslı TTS modelidir və bu səsin yalnız üç saniyəlik nümunəsini eşitdikdən sonra istənilən səsdə nitq yarada bilir. Bu, yeni səs yaratmaq üçün daha uzun təlim müddəti tələb edən əvvəlki modellərlə müqayisədə əhəmiyyətli irəliləyişdir.

VALL-E rəqəmsal media ilə qarşılıqlı əlaqəmizi dəyişdirmək potensialına malik heyrətamiz texnoloji nailiyyətdir.
Əlaqədar məqalə: “Microsoft” şirkəti insanın tək bir fotosundan 3D avatar yarada bilən diffuziya modeli buraxıb

Bundan əlavə, səsin intonasiyası, xarizması və üslubu yaradılan nitqdə qorunur. Bu, TTS sistemlərinin daha təbii səslənməsi üçün irəliyə doğru atılmış mühüm addımdır.

Bu model transformator əsaslıdır və Dale-1 görünüşünə malikdir. Diffuziya əsaslı Dalle-2 ilə qarışdırılmamalıdır. Kod hələ də çatışmır. İstifadəçilər isə onu yerləşdirəcəklərinə şübhə ilə yanaşırlar.

Əlaqədar məqalə: Microsoft-un VALL-E indiyə qədərki ən təhlükəli fırıldaq proqramı kimi görünür

Bununla belə, Microsoft fəaliyyətdə olan modelin bir neçə nümunəsini yayımladı və bunun TTS texnologiyasında böyük irəliləyiş olduğu aydındır.

Misal #1:

Nümunə #2:

Misal #3:

AI haqqında daha çox oxuyun:

Məsuliyyətdən imtina

uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.

Müəllif haqqında

Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi. 

Ətraflı məqalələr
Damir Yalalov
Damir Yalalov

Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi. 

Hot Stories
Bülletenimizə Qoşulun.
Son Xəbərlər

İnstitusional iştah dəyişkənlik fonunda Bitcoin ETF-lərə doğru artır

13F sənədləri vasitəsilə edilən açıqlamalar, Bitcoin ETF-ləri ilə məşğul olan görkəmli institusional investorları ortaya qoyur və bu, artan qəbulu vurğulayır ...

Daha çox məlumat

Hökm günü gəldi: ABŞ Məhkəməsi DOJ-nin iddiasını nəzərdən keçirərkən CZ-nin taleyi tarazlıqda qalır

Changpeng Zhao bu gün Sietldəki ABŞ məhkəməsində hökm oxumağa hazırlaşır.

Daha çox məlumat
İnnovativ Texniki İcmamıza Qoşulun
Daha çox oxu
Daha çox oxu
Morph Optimist zkEVM İnteqrasiyası, Körpü Mexanizmi və Mərkəzləşdirilməmiş Sequencer Şəbəkə Xüsusiyyətləri ilə Holesky Testnetini Təqdim edir
Xəbər Hesabatı Texnologiya
Morph Optimist zkEVM İnteqrasiyası, Körpü Mexanizmi və Mərkəzləşdirilməmiş Sequencer Şəbəkə Xüsusiyyətləri ilə Holesky Testnetini Təqdim edir
6 May 2024
Robinhood Crypto, Qiymətli Kağızlar və Birja Komissiyasından Qiymətli Kağızların İddia edilən pozuntuları ilə bağlı Wells bildirişi alır.
Markets Xəbər Hesabatı Texnologiya
Robinhood Crypto, Qiymətli Kağızlar və Birja Komissiyasından Qiymətli Kağızların İddia edilən pozuntuları ilə bağlı Wells bildirişi alır.
6 May 2024
QuickSwap X Layer Mainnet-də yerləşdirir və Citadel Launch ilə Poliqon CDK Şəbəkəsini genişləndirir
Xəbər Hesabatı Texnologiya
QuickSwap X Layer Mainnet-də yerləşdirir və Citadel Launch ilə Poliqon CDK Şəbəkəsini genişləndirir 
6 May 2024
Layer 2 Şəbəkə Xətti ZeroLend-in SIFIR Tokenini Təşviq edir Airdrop İstifadəçilər və İnvestorlar
Markets Xəbər Hesabatı Texnologiya
Layer 2 Şəbəkə Xətti ZeroLend-in SIFIR Tokenini Təşviq edir Airdrop İstifadəçilər və İnvestorlar
6 May 2024
CRYPTOMERIA LABS PTE. LTD.