SingSong: محققان هوش مصنوعی گوگل راهی برای تولید موسیقی برای همراهی با صدای ورودی پیدا می کنند
به طور خلاصه
سیستم جدید به نام SingSong از یک عمیق استفاده می کند مدل یادگیری برای تولید موسیقی که بیشتر از سیستم های موجود با آواز همخوانی دارد.
محققان میگویند که این سیستم میتواند برای ایجاد آهنگهای کارائوکه برای خوانندگان حرفهای یا کمک به خوانندگان آماتور در یافتن همراهی متناسب با صدایشان استفاده شود.
محققان گوگل راهی برای استفاده از هوش مصنوعی برای تولید موسیقی سازگار با آواز پیدا کرده اند. سیستم جدید که SingSong نام دارد، از یک مدل یادگیری عمیق برای تولید همراهی استفاده می کند که بیشتر از سایر سیستم های موجود با آواز همگام است. محققان میگویند که این سیستم میتواند برای ایجاد آهنگهای کارائوکه برای خوانندگان حرفهای یا کمک به خوانندگان آماتور در یافتن همراهی مناسبتر با صدایشان استفاده شود.
SingSong سیستمی است که توسط گوگل توسعه یافته است که موسیقی دستگاهی را برای همراهی با صدای ورودی ایجاد می کند. ممکن است هم برای نوازندگان و هم برای غیر موسیقیدانان یک رویکرد ساده جدید برای ساخت موسیقی با صدای خودشان فراهم کند. برای دستیابی به این هدف، توسعهدهندگان بر اساس پیشرفتهای اخیر در جداسازی منبع موسیقی و تولید صدا هستند. توسعه دهندگان به طور خاص از یک روش جداسازی منبع پیشرفته برای ایجاد جفت منبع آوازی و ابزاری از مجموعه عظیمی از ضبطهای موسیقی استفاده میکنند. سپس، توسعه دهندگان تغییر می دهند AudioLMیک روش پیشرفته برای تولید صوت بدون قید و شرط، به طوری که ممکن است بر روی جفت های جدا شده از منبع (آواز، ساز) برای وظایف تولید "صوت به صدا" مشروط آموزش داده شود.
محققان هوش مصنوعی ویژگیهای مختلف ورودیهای صوتی را بررسی میکنند، که بهترین آنها عملکرد کمی را در آوازهای جدا شده تا 53 درصد در مقایسه با ویژگی پیشفرض AudioLM افزایش میدهد، تا تعمیم سیستم را از دادههای آموزشی جدا شده از منبع (که در آن صداها حاوی مصنوعاتی هستند). ابزاری) تا آوازهای جدا شده ای که توسعه دهندگان ممکن است از کاربران انتظار داشته باشند. شنوندگان ترجیح قابل توجهی برای سازهای تولید شده توسط SingSong نسبت به آنهایی که از یک پایه بازیابی قوی در مقایسه دوتایی با ورودیهای صوتی یکسان داشتند، نشان دادند.
در مقابل، سیستم جدید از a استفاده می کند مدل یادگیری عمیق که بر روی مجموعه داده بزرگی از موسیقی آموزش داده شده است. این به سیستم اجازه می دهد تا همراهی هایی را ایجاد کند که با صدای خواننده و زمان بندی آن هماهنگ است.
برای مطالعه، به شنوندگان دو ماشاپ آوازی- ساز 10 ثانیه ای داده می شود که در آنها صداها (برگرفته از آزمون MUSDB18) یکسان هستند در حالی که سازها متفاوت هستند و از منابع مختلفی می آیند (حقیقت زمین، مدل های گوگل، یا خطوط پایه). این سوال از شنوندگان میخواهد که انتخاب کنند کدام یک از دو ترکیبی که حس میکنند پشتوانههای ساز از نظر موسیقایی بیشتر با آواز سازگار است.
نمونه های تازه SingSong
با استفاده از یک سری شبکه های عصبی عمیق و مدل های تولیدی، توسعه دهندگان قادر به تولید همراهی هارمونیک بدون تاخیر برای بخش های طولانی تر هستند.
صداهای حرفه ای مجموعه داده MUSDB18 در مثال های قبلی استفاده شد. ما همچنین شیفته توانایی SingSong برای پشتیبانی و قادر کردن هر کسی برای ایجاد موسیقی با صدای خود هستیم. در اینجا، ما این را با استفاده از نمونههای صوتی از مجموعه داده Vocadito بررسی میکنیم، که شامل ضبطهایی از خوانندههای آماتور ساخته شده بر روی لوازم الکترونیکی مصرفی است.
این سیستم هنوز در مراحل اولیه توسعه است. در حالی که محققان می گویند قبل از استفاده تجاری باید بهبود یابد، آنها معتقدند که این پتانسیل را دارد که صنعت کارائوکه را متحول کند و به خوانندگان آماتور کمک کند تا همراهی مناسبی برای آنها پیدا کنند.
مقالات مرتبط بیشتر را بخوانید:
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.
مقالات بیشترDamir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.