MusicLM: نموذج AI جديد لتحويل النص إلى موسيقى ومن صورة إلى موسيقى من Google
في سطور
تقدم Google MusicLM ، وهو نموذج لتوليد موسيقى عالية الدقة من الأوصاف النصية.
يمكن تكييف MusicLM على كل من النص واللحن من حيث أنه يمكن أن يحول الألحان الصافرة والهادئة وفقًا للأسلوب الموصوف في تعليق نصي.
يمكن للنموذج توليد الموسيقى في مجموعة متنوعة من الأنواع، بما في ذلك الكلاسيكية والجاز والروك.
تقدم Google MusicLM ، وهو نموذج لتوليد موسيقى عالية الدقة من أوصاف نصية مثل "لحن كمان مهدئ مدعوم بفرقة غيتار مشوهة". يلقي MusicLM عملية إنشاء الموسيقى الشرطية كمهمة نمذجة تسلسل إلى تسلسل هرمي ، وتولد موسيقى عند 24 كيلو هرتز تظل ثابتة على مدار عدة دقائق.
تُظهر تجارب Google أن MusicLM يتفوق في الأداء على الأنظمة السابقة ، من حيث جودة الصوت والالتزام بالوصف النصي. علاوة على ذلك ، فإنه يوضح أن MusicLM يمكن أن يكون مشروطًا بكل من النص واللحن من حيث أنه يمكن أن يحول الألحان الصافرة والهامهمة وفقًا للأسلوب الموصوف في تعليق نصي. لدعم البحث المستقبلي ، أصدرنا علنًا MusicCaps ، وهي مجموعة بيانات تتكون من 5.5 ألف زوج من أزواج نصوص موسيقية مع أوصاف نصية منسقة مقدمة من خبراء بشريين.
تم تدريب نموذج MusicLM على مجموعة كبيرة من المقطوعات الموسيقية، مما سمح للذكاء الاصطناعي بتعلم بنية الموسيقى. يمكن للنموذج توليد الموسيقى في مجموعة متنوعة من الأنواع، بما في ذلك الكلاسيكية والجاز والروك. بالإضافة إلى ذلك، يمكن لنموذج الذكاء الاصطناعي إنشاء تركيبات أصلية جديدة.
يعد نموذج MusicLM تطورًا مهمًا في مجال الموسيقى التي يتم إنشاؤها بواسطة الذكاء الاصطناعي. يمثل النموذج تقدمًا كبيرًا مقارنة بالموديلات السابقة ، والتي كانت تقتصر على المقطوعات الموسيقية القصيرة أو القادرة فقط على إنتاج ألحان بسيطة. يفتح النموذج الجديد إمكانية استخدام الذكاء الاصطناعي لتوليد مقطوعات موسيقية طويلة ومعقدة يمكن استخدامها في الأفلام أو ألعاب الفيديو أو الوسائط الأخرى.
يمكن لنموذج الذكاء الاصطناعي الجديد أن يولد موسيقى طويلة أجيال تصل إلى خمس دقائق.
يمكن لنموذج AI إنشاء موسيقى باستخدام تسميات توضيحية من الألعاب والأفلام.
بالإضافة إلى ذلك ، يمكن لنموذج AI إنشاء موسيقى باستخدام الصور كمدخلات.
اقرأ المزيد عن الذكاء الاصطناعي في صناعة الموسيقى:
إخلاء المسئولية
تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.
نبذة عن الكاتب
دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.
المزيد من المقالاتدامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.