Xəbər Hesabatı Texnologiya
Yanvar 03, 2024

MyShell AI başlanğıcı dəqiq səs klonlaması üçün OpenVoice alqoritmini buraxır

Qısaca

Kanadanın AI startapı MyShell, ani səs klonlaması üçün OpenVoice alqoritmini açıq mənbədən aldığını elan etdi.

MyShell AI başlanğıcı dəqiq səs klonlaması üçün OpenVoice alqoritmini buraxır

Respeecher, Voicemod və ElevenLabs – hər üç startapın ortaq bir cəhəti var – onların hamısı səs klonlarının yaradılması üçün alqoritmlər və süni intellekt proqramı təmin edir. İndi yeni oyunçu, Kanada AI başlanğıcı MyShell ani səs klonlaması üçün OpenVoice alqoritminin açıq mənbəli olduğunu elan etdi.

MyShell yeniləməni burada paylaşdı sosial media platforması X və dedi: “Sadəcə kiçik bir audio klipdən istifadə edərək, hisslərdən tutmuş vurğuya, ritmə, pauzalara və intonasiyaya qədər tona nəzarət edərək, misilsiz dəqiqliklə səsləri klonlayın.”

Əməkdaşlıq çərçivəsində MIT, MyShell.ai və Tsinghua Universitetinin tədqiqatçıları natiqin səsini təkrarlaya bilən və dildə nitq yarada bilən OpenVoice-u təqdim etdilər. çox dil, orijinal mənbədən yalnız qısa audio parçasını istifadə etməklə. O, həm də natiqin səsinin unikal tonunu və rəngini çəkir.

Şirkətdən verilən məlumata görə, alqoritm emosiya, vurğu, ritm, pauzalar və intonasiya kimi mühüm stilistik elementləri əlavə edir. Bu elementlər nitqin real səslənməsi və maraqlı söhbətlər yaratmaq üçün çox vacibdir. Bu, müntəzəm mətndən nitqə tez-tez aldığınız darıxdırıcı səsdən qaçmağa kömək edir.

Səs Klonlayan AI Modeli Necə İşləyir

A tədqiqat kağız, OpenVoice səs klonlama süni intellektinin arxasında duran metodologiyanı paylaşdı. OpenVoice iki fərqli səsdən ibarətdir AI modelləri: mətndən nitqə (TTS) modeli və “ton çeviricisi”.

Model üslub parametrlərini və dillərini idarə edə bilir və ingilis (həm Amerika, həm də Britaniya aksentində), Çin və Yapon dilində danışanlardan “30,000 cümlə istifadə edərək təlim” keçib. Təlimdə ifadə olunan emosiyalar əsasında nümunələrin etiketlənməsi nəzərdə tutulmuşdu və model bu audio kliplərdən intonasiya, ritm və pauzaları öyrənmişdir.

Digər tərəfdən, ton çevirici modeli 300,000-dən çox müxtəlif dinamikdən 20,000-dən çox səs nümunəsindən ibarət geniş məlumat toplusunda təlim keçmişdir. Hər iki halda, insan nitqinin səsi fonemlərə - sözləri fərqləndirən xüsusi səslərə çevrildi və vektor əlavələri ilə təmsil olundu.

“Əsas dinamik”dən istifadə edən TTS modeli təlim prosesində istifadəçinin qeydə aldığı səsdən əldə edilən tonla birləşir. Bu iki model birlikdə istifadəçinin səsini təkrarlaya və ton rəngini dəyişdirə bilər - danışıq mətnində ifadə olunan emosional ifadə.

Startap 2023-cü ildə yaradılıb. Keçən il MyShell INCE Capital-ın rəhbərlik etdiyi toxum maliyyələşdirməsi üçün 5.6 milyon dollar topladı və digərləri arasında Folius Ventures, Hashkey Capital, SevenX Ventures, TSVC və OP Crypto kimi tanınmış investorların iştirakını gördü.

Şirkətdən verilən məlumata görə, maliyyələşdirmə mülkiyyətçiliyin inkişafına kömək edəcək AI modelləri, süni intellektə malik tətbiqlər üçün uyğunlaşdırılmış Creator Studio-nun yaradılması və blokçeyn texnologiyası çərçivəsində canlı yaradıcı ekosisteminin yaradılması.

Məsuliyyətdən imtina

uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.

Müəllif haqqında

Kumar AI/ML-nin dinamik kəsişmələri, marketinq texnologiyaları və kriptovalyuta, blokçeyn və digər inkişaf etməkdə olan sahələr üzrə ixtisaslaşan təcrübəli Texniki Jurnalistdir. NFTs. Sənayedə 3 ildən çox təcrübəsi olan Kumar, cəlbedici povestlər hazırlamaq, dərin müsahibələr aparmaq və hərtərəfli fikirlər çatdırmaqda sübut edilmiş bir təcrübə yaratmışdır. Kumarın təcrübəsi görkəmli sənaye platformaları üçün məqalələr, hesabatlar və tədqiqat nəşrləri daxil olmaqla yüksək təsirli məzmunun hazırlanmasında yatır. Texniki bilik və hekayəni özündə birləşdirən unikal bacarıq dəsti ilə Kumar mürəkkəb texnoloji konsepsiyaları müxtəlif auditoriyalara aydın və cəlbedici şəkildə çatdırmaqda üstündür.

Ətraflı məqalələr
Kumar Qandharv
Kumar Qandharv

Kumar AI/ML-nin dinamik kəsişmələri, marketinq texnologiyaları və kriptovalyuta, blokçeyn və digər inkişaf etməkdə olan sahələr üzrə ixtisaslaşan təcrübəli Texniki Jurnalistdir. NFTs. Sənayedə 3 ildən çox təcrübəsi olan Kumar, cəlbedici povestlər hazırlamaq, dərin müsahibələr aparmaq və hərtərəfli fikirlər çatdırmaqda sübut edilmiş bir təcrübə yaratmışdır. Kumarın təcrübəsi görkəmli sənaye platformaları üçün məqalələr, hesabatlar və tədqiqat nəşrləri daxil olmaqla yüksək təsirli məzmunun hazırlanmasında yatır. Texniki bilik və hekayəni özündə birləşdirən unikal bacarıq dəsti ilə Kumar mürəkkəb texnoloji konsepsiyaları müxtəlif auditoriyalara aydın və cəlbedici şəkildə çatdırmaqda üstündür.

Hot Stories
Bülletenimizə Qoşulun.
Son Xəbərlər

İnstitusional iştah dəyişkənlik fonunda Bitcoin ETF-lərə doğru artır

13F sənədləri vasitəsilə edilən açıqlamalar, Bitcoin ETF-ləri ilə məşğul olan görkəmli institusional investorları ortaya qoyur və bu, artan qəbulu vurğulayır ...

Daha çox məlumat

Hökm günü gəldi: ABŞ Məhkəməsi DOJ-nin iddiasını nəzərdən keçirərkən CZ-nin taleyi tarazlıqda qalır

Changpeng Zhao bu gün Sietldəki ABŞ məhkəməsində hökm oxumağa hazırlaşır.

Daha çox məlumat
İnnovativ Texniki İcmamıza Qoşulun
Daha çox oxu
Daha çox oxu
NuLink Bybit üzərində işə başlayır Web3 IDO Platforması. Abunə Fazası Mayın 13-ə kimi uzadılır
Markets Xəbər Hesabatı Texnologiya
NuLink Bybit üzərində işə başlayır Web3 IDO Platforması. Abunə Fazası Mayın 13-ə kimi uzadılır
9 May 2024
UXLINK və Binance istifadəçilərə 20M UXUY xalları və təklif edən yeni kampaniyada əməkdaşlıq edir Airdrop Təltif və mükafatlar
Markets Xəbər Hesabatı Texnologiya
UXLINK və Binance istifadəçilərə 20M UXUY xalları və təklif edən yeni kampaniyada əməkdaşlıq edir Airdrop Təltif və mükafatlar
9 May 2024
Side Protocol Incentivized Testnet-i işə salır və istifadəçilərə SIDE xalları qazanmağa imkan verən Insider Point sistemini təqdim edir.
Markets Xəbər Hesabatı Texnologiya
Side Protocol Incentivized Testnet-i işə salır və istifadəçilərə SIDE xalları qazanmağa imkan verən Insider Point sistemini təqdim edir.
9 May 2024
Web3 və 2024-cü ilin May ayında Kripto Hadisələri: Blockchain-də Yeni Texnologiyaların və Yaranan Trendlərin Tədqiqi və DeFi
Həzm Biznes Markets Texnologiya
Web3 və 2024-cü ilin May ayında Kripto Hadisələri: Blockchain-də Yeni Texnologiyaların və Yaranan Trendlərin Tədqiqi və DeFi
9 May 2024
CRYPTOMERIA LABS PTE. LTD.