MyShell AI startupi aniq ovozli klonlash uchun OpenVoice algoritmini chiqaradi
Qisqacha
Kanadalik AI startapi MyShell lahzali ovozni klonlash uchun ochiq manbali OpenVoice algoritmini e'lon qildi.
Respeecher, Voicemod va ElevenLabs – har uchala startapning ham bitta umumiy jihati bor – ularning barchasi ovozli klonlar yaratish uchun algoritmlar va AI dasturini taqdim etadi. Endi yangi o'yinchi, Kanada AI startapi MyShell lahzali ovozni klonlash uchun OpenVoice algoritmini ochiq manbali deb e'lon qildi.
MyShell yangilanish bilan o'rtoqlashdi ijtimoiy media platformasi X va shunday dedi: "Ovozlarni misli ko'rilmagan aniqlik bilan, ohangni, hissiyotdan urg'uga, ritmga, pauza va intonatsiyaga qadar, shunchaki kichik audio klipdan foydalanib, klonlang."
Hamkorlik doirasida MIT, MyShell.ai va Tsinghua universiteti tadqiqotchilari ma'ruzachining ovozini takrorlashi va nutqni yaratishi mumkin bo'lgan OpenVoice-ni taqdim etishdi. bir nechta tillar, asl manbadan faqat qisqacha audio parchadan foydalanish. Shuningdek, u ma'ruzachi ovozining o'ziga xos ohangini va rangini qamrab oladi.
Kompaniya ma'lumotlariga ko'ra, algoritm hissiyot, urg'u, ritm, pauzalar va intonatsiya kabi hal qiluvchi stilistik elementlarni qo'shadi. Bu elementlar nutqni haqiqiy qilish va qiziqarli suhbatlar yaratish uchun juda muhimdir. Bu oddiy matndan nutqqa tez-tez eshitiladigan zerikarli tovushdan qochishga yordam beradi.
Ovozli klonlash AI modeli qanday ishlaydi
bir tadqiqot qog'oz, OpenVoice o'zining ovozli klonlash AI ortidagi metodologiya bilan o'rtoqlashdi. OpenVoice ikki xildan iborat AI modellari: matndan nutqqa (TTS) modeli va “ohang konvertori”.
Model uslub parametrlari va tillarini boshqarishi mumkin va ingliz tilidan (ham amerikacha, ham britaniyalik urg'uda), xitoy va yapon tilida so'zlashuvchilardan "30,000 XNUMX ta jumladan foydalangan holda treningdan" o'tgan. Treningda ifodalangan his-tuyg'ular asosida namunalarni belgilash va model ushbu audio kliplardan intonatsiya, ritm va pauzalarni o'rgandi.
Boshqa tomondan, ohang konvertori modeli 300,000 20,000 dan ortiq turli dinamiklardan XNUMX XNUMX dan ortiq audio namunalaridan iborat keng ma'lumotlar to'plamida o'qitildi. Ikkala holatda ham inson nutqi audiosi fonemalarga - so'zlarni farqlovchi o'ziga xos tovushlarga aylantirildi va vektor qo'shimchalari yordamida taqdim etildi.
"Asosiy dinamik" dan foydalangan holda TTS modeli o'quv jarayonida foydalanuvchining yozib olgan ovozidan olingan ohang bilan birlashadi. Bu ikki model birgalikda foydalanuvchining ovozini takrorlashi va ohang rangini o'zgartirishi mumkin - og'zaki matnda etkazilgan hissiy ifoda.
Startap 2023-yilda tashkil etilgan. O‘tgan yili MyShell INCE Capital boshchiligidagi 5.6 million dollar mablag‘ yig‘di va Folius Ventures, Hashkey Capital, SevenX Ventures, TSVC va OP Crypto kabi taniqli investorlar ishtirok etdi.
Kompaniya ma'lumotlariga ko'ra, moliyalashtirish mulkchilikni rivojlantirishga yordam beradi AI modellari, AI-native ilovalar uchun moslashtirilgan Creator Studio yaratish va blokcheyn texnologiyasi doirasida jonli ijodkorlar ekotizimini yaratish.
Masʼuliyatdan voz kechish
Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.
Muallif haqida
Kumar AI/ML, marketing texnologiyalari va kripto, blokcheyn kabi rivojlanayotgan sohalarning dinamik kesishmalariga ixtisoslashgan tajribali texnologiya jurnalisti. NFTs. Sanoatda 3 yildan ortiq tajribaga ega bo'lgan Kumar jozibali hikoyalar yaratish, chuqur intervyular o'tkazish va keng qamrovli tushunchalarni taqdim etish bo'yicha tasdiqlangan tajribaga ega. Kumarning tajribasi yuqori ta'sirli kontent, jumladan, taniqli sanoat platformalari uchun maqolalar, hisobotlar va tadqiqot nashrlarini ishlab chiqarishda yotadi. Texnik bilim va hikoya qilishni o'zida mujassam etgan noyob mahorat to'plamiga ega Kumar murakkab texnologik kontseptsiyalarni turli auditoriyalarga aniq va qiziqarli tarzda etkazishda ustunlik qiladi.
Boshqa maqolalarKumar AI/ML, marketing texnologiyalari va kripto, blokcheyn kabi rivojlanayotgan sohalarning dinamik kesishmalariga ixtisoslashgan tajribali texnologiya jurnalisti. NFTs. Sanoatda 3 yildan ortiq tajribaga ega bo'lgan Kumar jozibali hikoyalar yaratish, chuqur intervyular o'tkazish va keng qamrovli tushunchalarni taqdim etish bo'yicha tasdiqlangan tajribaga ega. Kumarning tajribasi yuqori ta'sirli kontent, jumladan, taniqli sanoat platformalari uchun maqolalar, hisobotlar va tadqiqot nashrlarini ishlab chiqarishda yotadi. Texnik bilim va hikoya qilishni o'zida mujassam etgan noyob mahorat to'plamiga ega Kumar murakkab texnologik kontseptsiyalarni turli auditoriyalarga aniq va qiziqarli tarzda etkazishda ustunlik qiladi.