هوش مصنوعی گوگل اولین تولیدکننده متن به موسیقی AudioLM را معرفی کرد
به طور خلاصه
AudioLM می تواند فقط با گوش دادن به صداها موسیقی تولید کند
Mubert AI برای ادامه سخنرانی انسان و موسیقی پیانو
با GPT-3 و دیگران، ایده هوش مصنوعی مولد شانس خوبی برای پیشرفت دارد. ما همچنین مفاهیم inpainting و outpainting را کشف کردیم. هوش مصنوعی تصاویر را با حفظ تم و سبک به طرز ماهرانه ای کامل می کند. در مورد موسیقی چطور؟
و باز هم! از آنجایی که همه اینها بر اساس مدلهای زبان هوش مصنوعی است که معنا را حفظ میکند، استفاده از این فناوری در موسیقی فقط یک مسئله زمان بود. و اکنون زمان آن فرا رسیده است.
طبق تحقیقات اخیر گوگل، چارچوب جدیدی برای تولید صدا به نام AudioLM ممکن است آموزش داده شود تا گفتار واقعی و موسیقی پیانو را به سادگی با گوش دادن به صداها ایجاد کند. به دلیل ثبات طولانی مدت و وفاداری عالی، AudioLM از سیستم های قبلی پیشی می گیرد و با برنامه های کاربردی در سنتز صدا و موسیقی به کمک رایانه، ایجاد صدا را پیش می برد.
AudioLM از هوش مصنوعی گوگل میتواند یک گذر صوتی را در عین حال که "نیت" را حفظ کند، گسترش دهد. در حال حاضر، بر اساس نمونه محدودی از داده های ورودی، برای ادامه گفتار انسان و موسیقی پیانو آموزش دیده است. نمونه زیر را بررسی کنید.
معیارهای سخنرانی ساده بود: از شنوندگان خواسته شد تا ارزیابی کنند که آیا ادامه آن شبیه گفتار انسان است یا خیر. با موسیقی، مشخص شد که "ادامه" بخش ارائه شده برای ورودی از نظر کیفیت بسیار برتر از همه تولید کننده های موسیقی فعلی از ابتدا است، مانند جعبه جعبه. با یک پیشنهاد در ورودی، هوش مصنوعی موسیقی را بطور قابل توجهی بهتر ادامه می دهد.
ارزیاب های انسانی برای تایید نتایج به نمونه های صوتی گوش دادند. آنها تعیین کردند که آیا آنها در حال شنیدن ادامه واقعی صدای انسانی هستند که ضبط شده بود یا صدای مصنوعی تولید شده توسط AudioLM. داده های آنها نشان دهنده میزان موفقیت 51.2٪ است. در نتیجه، تشخیص گفتار تولید شده توسط AudioLM و گفتار واقعی انسان برای شنونده عادی چالش برانگیز خواهد بود.
آیا فناوری تبدیل متن به موسیقی تجارت موسیقی را تغییر می دهد؟
یک تولید کننده متن به موسیقی بر اساس Mubert API اخیرا توسط یک مدل هوش مصنوعی دیگر به نام Mubert معرفی شد. Mubert برای هر درخواستی که ارسال می کنید مجموعه متفاوتی از صداها ایجاد می کند. احتمال تکرار واقعا کم است. موسیقی زمانی ایجاد می شود که درخواستی ارائه شود. از پایگاه داده آهنگ های تمام شده استخراج نشده است. چقدر واقعا مولد این موسیقی سوال رایجی است
صداها قبل از ایجاد انتخاب می شوند. هم اعلان ورودی و هم تگ های Mubert API در بردار فضای پنهان شبکه عصبی ترانسفورماتور کدگذاری می شوند. سپس نزدیکترین بردار برچسب برای هر پرس و جو انتخاب می شود و برچسب های همراه برای ایجاد موسیقی به API ما منتقل می شوند. هیچ شبکه عصبی برای ساخت هیچ یک از صداها (حلقه های مجزا برای باس، لید و غیره) استفاده نشد. همه صداها توسط نوازندگان و طراحان صدا تولید شده است.
گام مهم بعدی موبرت این است که آیتم هایی از دنیای کنونی مانند عکس ها، فیلم ها، سناریوها و ارائه ها را بگیرد و موسیقی دنیای اطراف خود را بسازد.
در اینجا چیزی است که می توانید با قرار دادن بی پروا پیام های متنی در دهان موزیکال Mubert AI به دست آورید:
این مرحله اولیه در فرآیند ساخت یک الگوریتم تولید پیچیده تر و دقیق تر است، اما این کار به زمان و هزینه نیاز دارد.
با این حال، فناوری تبدیل متن به موسیقی در حال حاضر در دسترس است، بنابراین میتوانید آلبومها را به صورت انبوه با جایگزین کردن «اعلام ورودی» برای «نوشتن یک اسکریپت اعلان تصادفی» تولید کنید. به نظر می رسد دیگر نیازی به هنرمندان نیست.
ادامه خبر مرتبط را بخوانید:
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.
مقالات بیشترDamir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.