MusicLM: یک مدل جدید هوش مصنوعی متن به موسیقی و تصویر به موسیقی از گوگل
به طور خلاصه
گوگل MusicLM را معرفی می کند، مدلی برای تولید موسیقی با کیفیت بالا از توضیحات متن.
MusicLM را میتوان هم به متن و هم به ملودی مشروط کرد، زیرا میتواند ملودیهای سوت و زمزمهشده را مطابق با سبکی که در شرح متن توضیح داده شده تغییر دهد.
مدل می تواند تولید موسیقی در ژانرهای مختلف از جمله کلاسیک، جاز و راک.
Google MusicLM را معرفی میکند، مدلی برای تولید موسیقی با کیفیت بالا از توضیحات متنی مانند «یک ملودی آرامشبخش ویولن با پشتوانه یک ریف گیتار تحریفشده». MusicLM فرآیند تولید موسیقی شرطی را به عنوان یک کار مدلسازی سلسله مراتبی دنباله به دنباله ارائه میکند و موسیقی را با فرکانس 24 کیلوهرتز تولید میکند که طی چند دقیقه ثابت میماند.
آزمایشهای Google نشان میدهد که MusicLM از سیستمهای قبلی، هم از نظر کیفیت صدا و هم در رعایت توضیحات متن، بهتر عمل میکند. علاوه بر این، نشان میدهد که MusicLM میتواند هم به متن و هم به ملودی مشروط شود، زیرا میتواند ملودیهای سوتزده و زمزمهشده را مطابق با سبک توصیفشده در زیرنویس متن تغییر دهد. برای حمایت از تحقیقات آینده، MusicCaps را به صورت عمومی منتشر میکنیم، مجموعه دادهای متشکل از 5.5 هزار جفت موسیقی-متن با توضیحات متن غنی که توسط متخصصان انسانی ارائه شده است.
مقاله مرتبط: تبدیل متن به سه بعدی: گوگل یک شبکه عصبی ایجاد کرده است که مدل های سه بعدی را از توضیحات متن تولید می کند |
مدل MusicLM روی مجموعه بزرگی از موسیقیها آموزش داده شده است که به هوش مصنوعی اجازه میدهد ساختار موسیقی را بیاموزد. مدل می تواند تولید موسیقی در ژانرهای مختلف از جمله کلاسیک، جاز و راک. علاوه بر این، مدل هوش مصنوعی می تواند ترکیبات جدید و اصلی ایجاد کند.
مدل MusicLM یک پیشرفت مهم در زمینه موسیقی تولید شده توسط هوش مصنوعی است. این مدل نشان دهنده پیشرفت قابل توجهی نسبت به مدل های قبلی است که به قطعات کوتاه تر موسیقی محدود می شدند یا فقط قادر به تولید ملودی های ساده بودند. مدل جدید امکان استفاده از هوش مصنوعی را برای تولید قطعات طولانی و پیچیده موسیقی که میتواند در فیلمها، بازیهای ویدیویی یا رسانههای دیگر مورد استفاده قرار گیرد، باز میکند.
مدل جدید هوش مصنوعی می تواند موسیقی طولانی تولید کند نسل تا پنج دقیقه.
مدل هوش مصنوعی می تواند با استفاده از زیرنویس بازی ها و فیلم ها موسیقی ایجاد کند.
علاوه بر این، مدل هوش مصنوعی می تواند با استفاده از تصاویر به عنوان ورودی موسیقی تولید کند.
درباره هوش مصنوعی در صنعت موسیقی بیشتر بخوانید:
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.
مقالات بیشترDamir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.