SingSong: Google AI tədqiqatçıları daxil olan vokalları müşayiət etmək üçün musiqi yaratmaq üçün bir yol tapırlar
Qısaca
SingSong adlı yeni sistem dərindən istifadə edir öyrənmə modeli mövcud sistemlərdən daha çox oxumaqla uyğun gələn musiqi yaratmaq.
Tədqiqatçılar bildirirlər ki, sistem peşəkar müğənnilər üçün karaoke trekləri yaratmaq və ya həvəskar müğənnilərə öz səslərinə uyğun müşayiəti tapmaqda kömək etmək üçün istifadə edilə bilər.
Google-un tədqiqatçıları süni intellektdən istifadə edərək oxumağa uyğun musiqi yaratmaq yolunu tapıblar. SingSong adlanan yeni sistem digər mövcud sistemlərə nisbətən oxuma ilə daha çox uyğun gələn müşayiət yaratmaq üçün dərin öyrənmə modelindən istifadə edir. Tədqiqatçılar bildirirlər ki, sistem peşəkar müğənnilər üçün karaoke trekləri yaratmaq və ya həvəskar müğənnilərə öz səslərinə daha yaxşı uyğun gələn müşayiəti tapmaqda kömək etmək üçün istifadə edilə bilər.
Mahnı oxumaq daxil vokalları müşayiət etmək üçün instrumental musiqi yaradan Google tərəfindən hazırlanmış sistemdir. O, həm musiqiçilərə, həm də qeyri-musiqiçilərə öz səslərini əks etdirən musiqi yaratmaq üçün sadə yeni yanaşma təqdim edə bilər. Tərtibatçılar buna nail olmaq üçün musiqi mənbəyinin ayrılması və audio istehsalı sahəsində son nailiyyətlərə əsaslanırlar. Tərtibatçılar xüsusi olaraq böyük bir musiqi yazısı korpusundan uyğunlaşdırılmış vokal və instrumental mənbə cütləri yaratmaq üçün qabaqcıl mənbə ayırma metodundan istifadə edirlər. Sonra tərtibatçılar dəyişdirirlər AudioLM, şərtsiz audio istehsalı üçün qabaqcıl üsuldur ki, o, şərti “audio-audio” yaratmaq tapşırıqları üçün mənbədən ayrılmış (vokal, instrumental) cütlər üzrə təlim keçə bilsin.
Tövsiyə olunan yazı: Pulsuz treklər yaratmaq üçün ən yaxşı 5 AI Musiqi və Audio Generatorlar |
Süni intellekt tədqiqatçıları, mənbədən ayrılmış təlim məlumatlarından sistemin ümumiləşdirilməsini təkmilləşdirmək üçün (vokallarda vokalın artefaktları var) defolt AudioLM xüsusiyyəti ilə müqayisədə ən yaxşısı təcrid olunmuş vokallarda kəmiyyət performansını 53% artıran vokal girişlərinin müxtəlif xüsusiyyətlərini araşdırırlar. instrumental) tərtibatçıların istifadəçilərdən gözləyə biləcəyi təcrid olunmuş vokallara. Dinləyicilər eyni səs daxiletmələri ilə ikili müqayisədə SingSong tərəfindən hazırlanmış instrumentallara güclü axtarış bazasından olanlara əhəmiyyətli üstünlük verdilər.
Yeni sistem, əksinə, a istifadə edir dərin öyrənmə modeli musiqinin böyük bir verilənlər bazası üzərində təlim keçmişdir. Bu, sistemə müğənninin səsi və vaxtı ilə uyğun gələn müşayiət yaratmağa imkan verir.
Tədqiqat üçün dinləyicilərə 10 saniyəlik iki vokal-instrumental mashup verilir, burada səslər (MSDB18-testindən götürülmüşdür) eyni, instrumentallar isə fərqlidir və müxtəlif mənbələrdən gəlir (əsas həqiqət, google modelləri, və ya əsas göstəricilər). Sual dinləyicilərdən iki kombinasiyadan hansının instrumental fonların vokala daha musiqi uyğun gəldiyini seçmələrini xahiş edir.
Tövsiyə olunan yazı: Ən yaxşı 7 AI səs generatorları və mətndən nitqə üçün səs klonlaması |
SingSong-un Təzə Nümunələri
Bir sıra dərin neyron şəbəkələrdən istifadə etməklə və generativ modellər, tərtibatçılar daha uzun seqmentlər üçün gecikmə olmadan harmonik müşayiətlər yarada bilirlər.
MSDB18 məlumat dəstinin peşəkar səsləri əvvəlki nümunələrdə istifadə edilmişdir. Biz həmçinin SingSong-un hər kəsə öz səsi ilə musiqi yaratmağı dəstəkləmək və imkan vermək qabiliyyəti ilə maraqlanırıq. Burada biz bunu Vocadito məlumat dəstindən istifadə edərək, həvəskar vokalçıların istehlakçı elektronikasında çəkilmiş səsyazmalarından istifadə edərək araşdırırıq.
Sistem hələ inkişafın ilkin mərhələsindədir. Tədqiqatçılar onun kommersiya məqsədli istifadə edilməzdən əvvəl təkmilləşdirilməsi lazım olduğunu desələr də, onun karaoke sənayesində inqilab etmək və həvəskar müğənnilərə özlərinə uyğun olan müşayiəti tapmaqda köməklik etmək potensialına malik olduğuna inanırlar.
Daha çox əlaqəli məqaləni oxuyun:
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.
Ətraflı məqalələrDamir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.