VALL-E: Microsoft-ning yangi nol-shot matndan nutqqa modeli uch soniya ichida hamma ovozini takrorlashi mumkin
Qisqacha
Har qanday ovozning uch soniyali namunasi bilan transformatorga asoslangan TTS modeli VALL-E har bir ovozda nutq ishlab chiqishi mumkin.
Bu ko'proq tabiiy tovushli TTS tizimlari yo'nalishidagi sezilarli muvaffaqiyatdir.
Biroq, Microsoft qo'llanilayotgan modelning bir nechta namunalarini taqdim etdi va bu TTS texnologiyasidagi muhim rivojlanishni ifodalashi aniq.
Birinchi matndan nutqqa (TTS) modeli chiqarilgandan beri tadqiqotchilar ushbu tizimlarning nutqni yaratish usullarini yaxshilash yo'llarini izlashdi. Microsoft-ning so'nggi modeli, vodiy, bu boradagi muhim qadamdir.
VALL-E transformatorga asoslangan TTS modeli boʻlib, u ovozning uch soniyali namunasini eshitgandan soʻng har qanday ovozda nutq hosil qila oladi. Bu avvalgi modellarga nisbatan sezilarli yaxshilanish bo‘lib, yangi ovozni yaratish uchun ancha uzoqroq o‘quv davri talab etiladi.
O'xshash maqola: Microsoft kompaniyasi insonning bitta suratidan 3D avatar yasay oladigan diffuziya modelini chiqardi |
Bundan tashqari, intonatsiya, xarizma va ovozning uslubi yaratilgan nutqda saqlanib qoladi. Bu TTS tizimlarining tovushini tabiiyroq qilish uchun muhim qadamdir.
Ushbu model transformatorga asoslangan va Dale-1 ko'rinishiga ega. Diffuziyaga asoslangan Dalle-2 bilan adashtirmaslik kerak. Kod hali ham etishmayapti. Foydalanuvchilar esa uni joylashtirishlariga shubha bilan qarashadi.
Biroq, Microsoft amaldagi modelning bir nechta misollarini e'lon qildi va bu TTS texnologiyasidagi katta muvaffaqiyat ekanligi aniq.
Misol #1:
Misol #2:
Misol #3:
AI haqida ko'proq o'qing:
Masʼuliyatdan voz kechish
Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.
Muallif haqida
Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.
Boshqa maqolalarDamir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.