گزارش خبری پیشرفته
ژانویه 31، 2023

MusicLM: یک مدل جدید هوش مصنوعی متن به موسیقی و تصویر به موسیقی از گوگل

به طور خلاصه

گوگل MusicLM را معرفی می کند، مدلی برای تولید موسیقی با کیفیت بالا از توضیحات متن.

MusicLM را می‌توان هم به متن و هم به ملودی مشروط کرد، زیرا می‌تواند ملودی‌های سوت و زمزمه‌شده را مطابق با سبکی که در شرح متن توضیح داده شده تغییر دهد.

مدل می تواند تولید موسیقی در ژانرهای مختلف از جمله کلاسیک، جاز و راک.

Google MusicLM را معرفی می‌کند، مدلی برای تولید موسیقی با کیفیت بالا از توضیحات متنی مانند «یک ملودی آرامش‌بخش ویولن با پشتوانه یک ریف گیتار تحریف‌شده». MusicLM فرآیند تولید موسیقی شرطی را به عنوان یک کار مدل‌سازی سلسله مراتبی دنباله به دنباله ارائه می‌کند و موسیقی را با فرکانس 24 کیلوهرتز تولید می‌کند که طی چند دقیقه ثابت می‌ماند.

MusicLM: یک مدل جدید هوش مصنوعی متن به موسیقی و تصویر به موسیقی از گوگل

آزمایش‌های Google نشان می‌دهد که MusicLM از سیستم‌های قبلی، هم از نظر کیفیت صدا و هم در رعایت توضیحات متن، بهتر عمل می‌کند. علاوه بر این، نشان می‌دهد که MusicLM می‌تواند هم به متن و هم به ملودی مشروط شود، زیرا می‌تواند ملودی‌های سوت‌زده و زمزمه‌شده را مطابق با سبک توصیف‌شده در زیرنویس متن تغییر دهد. برای حمایت از تحقیقات آینده، MusicCaps را به صورت عمومی منتشر می‌کنیم، مجموعه داده‌ای متشکل از 5.5 هزار جفت موسیقی-متن با توضیحات متن غنی که توسط متخصصان انسانی ارائه شده است.

مقاله مرتبط: تبدیل متن به سه بعدی: گوگل یک شبکه عصبی ایجاد کرده است که مدل های سه بعدی را از توضیحات متن تولید می کند

مدل MusicLM روی مجموعه بزرگی از موسیقی‌ها آموزش داده شده است که به هوش مصنوعی اجازه می‌دهد ساختار موسیقی را بیاموزد. مدل می تواند تولید موسیقی در ژانرهای مختلف از جمله کلاسیک، جاز و راک. علاوه بر این، مدل هوش مصنوعی می تواند ترکیبات جدید و اصلی ایجاد کند.

مدل MusicLM یک پیشرفت مهم در زمینه موسیقی تولید شده توسط هوش مصنوعی است. این مدل نشان دهنده پیشرفت قابل توجهی نسبت به مدل های قبلی است که به قطعات کوتاه تر موسیقی محدود می شدند یا فقط قادر به تولید ملودی های ساده بودند. مدل جدید امکان استفاده از هوش مصنوعی را برای تولید قطعات طولانی و پیچیده موسیقی که می‌تواند در فیلم‌ها، بازی‌های ویدیویی یا رسانه‌های دیگر مورد استفاده قرار گیرد، باز می‌کند.

مدل جدید هوش مصنوعی می تواند موسیقی طولانی تولید کند نسل تا پنج دقیقه.

مقاله مرتبط: Stable Diffusion می تواند با تولید طیف نگارها بر اساس متن، موسیقی جدیدی ایجاد کند

مدل هوش مصنوعی می تواند با استفاده از زیرنویس بازی ها و فیلم ها موسیقی ایجاد کند.

علاوه بر این، مدل هوش مصنوعی می تواند با استفاده از تصاویر به عنوان ورودی موسیقی تولید کند.

درباره هوش مصنوعی در صنعت موسیقی بیشتر بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

در میان نوسانات، اشتهای سازمانی به سمت ETF های بیت کوین رشد می کند

افشاگری از طریق پرونده های 13F نشان می دهد که سرمایه گذاران نهادی قابل توجهی در ETF های بیت کوین مشغول هستند و بر پذیرش فزاینده ...

بیشتر بدانید

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
MPost به رهبران صنعت در کمپین "Bitcoin Deserves An Emoji" ملحق می شود و از ادغام نماد بیت کوین در هر صفحه کلید مجازی پشتیبانی می کند.
شیوه زندگی گزارش خبری پیشرفته
MPost به رهبران صنعت در کمپین "Bitcoin Deserves An Emoji" ملحق می شود و از ادغام نماد بیت کوین در هر صفحه کلید مجازی پشتیبانی می کند.
ممکن است 10، 2024
Crypto Exchange OKX Notcoin را فهرست می کند، قرار است معاملات نقطه ای را با جفت NOT-USDT در 16 می معرفی کند.
بازارها گزارش خبری پیشرفته
Crypto Exchange OKX Notcoin را فهرست می کند، قرار است معاملات نقطه ای را با جفت NOT-USDT در 16 می معرفی کند.  
ممکن است 10، 2024
Blast سومین رویداد توزیع طلا را راه اندازی کرد و 15 میلیون امتیاز به DApps اختصاص داد
بازارها گزارش خبری پیشرفته
Blast سومین رویداد توزیع طلا را راه اندازی کرد و 15 میلیون امتیاز به DApps اختصاص داد
ممکن است 10، 2024
Espresso Systems با Polygon Labs برای توسعه AggLayer برای افزایش قابلیت همکاری Rollup همکاری می کند.
کسب و کار گزارش خبری پیشرفته
Espresso Systems با Polygon Labs برای توسعه AggLayer برای افزایش قابلیت همکاری Rollup همکاری می کند.
ممکن است 9، 2024
CRYPTOMERIA LABS PTE. محدود