SingSong: باحثو الذكاء الاصطناعي في Google يجدون طريقة لتوليد الموسيقى لمرافقة غناء الإدخال
في سطور
يستخدم النظام الجديد المسمى SingSong تقنية عميقة نموذج التعلم لتوليد موسيقى أكثر تزامنًا مع الغناء من الأنظمة الموجودة.
يقول الباحثون إنه يمكن استخدام النظام لإنشاء مسارات كاريوكي للمغنين المحترفين أو لمساعدة المطربين الهواة في العثور على المرافقة التي تتناسب مع أصواتهم.
اكتشف باحثون في Google طريقة لاستخدام الذكاء الاصطناعي لتوليد موسيقى متوافقة مع الغناء. يستخدم النظام الجديد ، المسمى SingSong ، نموذج التعلم العميق لإنشاء مرافقة أكثر تزامنًا مع الغناء من الأنظمة الحالية الأخرى. يقول الباحثون إنه يمكن استخدام النظام لإنشاء مسارات كاريوكي للمغنين المحترفين أو لمساعدة المطربين الهواة في العثور على مرافقة تناسب أصواتهم بشكل أفضل.
يغني اغنية هو نظام تم تطويره بواسطة Google لإنشاء موسيقى الآلات لمرافقة غناء الإدخال. قد يزود كل من الموسيقيين وغير الموسيقيين بنهج جديد بسيط لصنع الموسيقى التي تتميز بأصواتهم الخاصة. يعتمد المطورون على التطورات الحديثة في فصل المصادر الموسيقية وإنتاج الصوت لتحقيق ذلك. يستخدم المطورون على وجه التحديد طريقة فصل المصادر المتطورة لبناء أزواج من المصادر الصوتية والآلات من مجموعة ضخمة من التسجيلات الموسيقية. ثم يقوم المطورون بالتعديل AudioLM، طريقة متطورة لإنتاج الصوت غير المشروط ، بحيث يمكن تدريبه على أزواج مفصولة عن المصدر (صوتي ، آلي) لمهام توليد "الصوت إلى الصوت" الشرطية.
منشور موصى به: أفضل 5 مولدات للموسيقى والصوت تعمل بالذكاء الاصطناعي لإنشاء مسارات خالية من حقوق الملكية |
يقوم باحثو الذكاء الاصطناعي بالتحقيق في التوصيفات المختلفة للمدخلات الصوتية ، وأفضلها يعزز الأداء الكمي للغناء المعزول بنسبة 53٪ مقارنة بميزة AudioLM الافتراضية ، من أجل تحسين تعميم النظام من بيانات التدريب المنفصلة عن المصدر (حيث تحتوي الأصوات على قطع أثرية من مفيدة) إلى الأغاني المعزولة التي قد يتوقعها مطورو البرامج من المستخدمين. أظهر المستمعون تفضيلًا كبيرًا للأدوات الموسيقية التي تنتجها SingSong على تلك من خط أساس استرجاع قوي في مقارنة زوجية مع نفس المدخلات الصوتية.
على النقيض من ذلك ، يستخدم النظام الجديد ملف نموذج التعلم العميق تم تدريبه على مجموعة بيانات كبيرة من الموسيقى. يتيح ذلك للنظام إنشاء مرافقة متزامنة مع صوت المغني وتوقيته.
بالنسبة للدراسة، يتم إعطاء المستمعين مزيجين صوتيين مدتهما 10 ثوانٍ تكون فيهما الأصوات (المأخوذة من اختبار MUSDB18) متماثلة بينما تختلف الآلات الموسيقية وتأتي من مصادر مختلفة (الحقيقة الأساسية، نماذج جوجلأو خطوط الأساس). يطلب السؤال من المستمعين اختيار أي من المجموعتين يشعرون أن الدعامات الآلية تناسب الغناء بشكل أكبر من الناحية الموسيقية.
أمثلة SingSong الطازجة
باستخدام سلسلة من الشبكات العصبية العميقة و نماذج مولدة، يستطيع المطورون إنتاج مرافقات توافقية بدون زمن انتقال للمقاطع الأطول.
تم استخدام الأصوات المهنية لمجموعة البيانات MUSDB18 في الأمثلة السابقة. نحن أيضًا مفتونون بقدرة SingSong على دعم وتمكين أي شخص من إنشاء موسيقى بأصواتهم. هنا ، نقوم بفحص هذا باستخدام عينات صوتية من مجموعة بيانات Vocadito ، والتي تتضمن تسجيلات المطربين الهواة المصنوعة على الإلكترونيات الاستهلاكية.
لا يزال النظام في المراحل الأولى من التطوير. في حين يقول الباحثون إنها بحاجة إلى تحسين قبل استخدامها تجاريًا ، إلا أنهم يعتقدون أن لديها القدرة على إحداث ثورة في صناعة الكاريوكي ومساعدة المطربين الهواة في العثور على المرافقة التي تناسبهم.
اقرأ المزيد من المقالات ذات الصلة:
إخلاء المسئولية
تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.
نبذة عن الكاتب
دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.
المزيد من المقالاتدامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.