گزارش خبری
اکتبر 21، 2022

هوش مصنوعی گوگل اولین تولیدکننده متن به موسیقی AudioLM را معرفی کرد

به طور خلاصه

AudioLM می تواند فقط با گوش دادن به صداها موسیقی تولید کند

Mubert AI برای ادامه سخنرانی انسان و موسیقی پیانو

با GPT-3 و دیگران، ایده هوش مصنوعی مولد شانس خوبی برای پیشرفت دارد. ما همچنین مفاهیم inpainting و outpainting را کشف کردیم. هوش مصنوعی تصاویر را با حفظ تم و سبک به طرز ماهرانه ای کامل می کند. در مورد موسیقی چطور؟

و باز هم! از آنجایی که همه اینها بر اساس مدل‌های زبان هوش مصنوعی است که معنا را حفظ می‌کند، استفاده از این فناوری در موسیقی فقط یک مسئله زمان بود. و اکنون زمان آن فرا رسیده است.

هوش مصنوعی گوگل اولین تولیدکننده متن به موسیقی AudioLM را معرفی کرد

طبق تحقیقات اخیر گوگل، چارچوب جدیدی برای تولید صدا به نام AudioLM ممکن است آموزش داده شود تا گفتار واقعی و موسیقی پیانو را به سادگی با گوش دادن به صداها ایجاد کند. به دلیل ثبات طولانی مدت و وفاداری عالی، AudioLM از سیستم های قبلی پیشی می گیرد و با برنامه های کاربردی در سنتز صدا و موسیقی به کمک رایانه، ایجاد صدا را پیش می برد.

ما سیستمی برای تشخیص صداهای مصنوعی تولید شده توسط AudioLM با استفاده از همان مفاهیم هوش مصنوعی ایجاد کرده‌ایم که زیربنای ایجاد مدل‌های قبلی ما بود.

AudioLM از هوش مصنوعی گوگل می‌تواند یک گذر صوتی را در عین حال که "نیت" را حفظ کند، گسترش دهد. در حال حاضر، بر اساس نمونه محدودی از داده های ورودی، برای ادامه گفتار انسان و موسیقی پیانو آموزش دیده است. نمونه زیر را بررسی کنید.

معیارهای سخنرانی ساده بود: از شنوندگان خواسته شد تا ارزیابی کنند که آیا ادامه آن شبیه گفتار انسان است یا خیر. با موسیقی، مشخص شد که "ادامه" بخش ارائه شده برای ورودی از نظر کیفیت بسیار برتر از همه تولید کننده های موسیقی فعلی از ابتدا است، مانند جعبه جعبه. با یک پیشنهاد در ورودی، هوش مصنوعی موسیقی را بطور قابل توجهی بهتر ادامه می دهد.

هوش مصنوعی گوگل اولین تولیدکننده متن به موسیقی AudioLM را معرفی کرد

ارزیاب های انسانی برای تایید نتایج به نمونه های صوتی گوش دادند. آنها تعیین کردند که آیا آنها در حال شنیدن ادامه واقعی صدای انسانی هستند که ضبط شده بود یا صدای مصنوعی تولید شده توسط AudioLM. داده های آنها نشان دهنده میزان موفقیت 51.2٪ است. در نتیجه، تشخیص گفتار تولید شده توسط AudioLM و گفتار واقعی انسان برای شنونده عادی چالش برانگیز خواهد بود.

آیا فناوری تبدیل متن به موسیقی تجارت موسیقی را تغییر می دهد؟

یک تولید کننده متن به موسیقی بر اساس Mubert API اخیرا توسط یک مدل هوش مصنوعی دیگر به نام Mubert معرفی شد. Mubert برای هر درخواستی که ارسال می کنید مجموعه متفاوتی از صداها ایجاد می کند. احتمال تکرار واقعا کم است. موسیقی زمانی ایجاد می شود که درخواستی ارائه شود. از پایگاه داده آهنگ های تمام شده استخراج نشده است. چقدر واقعا مولد این موسیقی سوال رایجی است

آیا فناوری تبدیل متن به موسیقی تجارت موسیقی را تغییر می دهد؟

صداها قبل از ایجاد انتخاب می شوند. هم اعلان ورودی و هم تگ های Mubert API در بردار فضای پنهان شبکه عصبی ترانسفورماتور کدگذاری می شوند. سپس نزدیکترین بردار برچسب برای هر پرس و جو انتخاب می شود و برچسب های همراه برای ایجاد موسیقی به API ما منتقل می شوند. هیچ شبکه عصبی برای ساخت هیچ یک از صداها (حلقه های مجزا برای باس، لید و غیره) استفاده نشد. همه صداها توسط نوازندگان و طراحان صدا تولید شده است.

گام مهم بعدی موبرت این است که آیتم هایی از دنیای کنونی مانند عکس ها، فیلم ها، سناریوها و ارائه ها را بگیرد و موسیقی دنیای اطراف خود را بسازد.

در اینجا چیزی است که می توانید با قرار دادن بی پروا پیام های متنی در دهان موزیکال Mubert AI به دست آورید:

این مرحله اولیه در فرآیند ساخت یک الگوریتم تولید پیچیده تر و دقیق تر است، اما این کار به زمان و هزینه نیاز دارد.

با این حال، فناوری تبدیل متن به موسیقی در حال حاضر در دسترس است، بنابراین می‌توانید آلبوم‌ها را به صورت انبوه با جایگزین کردن «اعلام ورودی» برای «نوشتن یک اسکریپت اعلان تصادفی» تولید کنید. به نظر می رسد دیگر نیازی به هنرمندان نیست.

ادامه خبر مرتبط را بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

در میان نوسانات، اشتهای سازمانی به سمت ETF های بیت کوین رشد می کند

افشاگری از طریق پرونده های 13F نشان می دهد که سرمایه گذاران نهادی قابل توجهی در ETF های بیت کوین مشغول هستند و بر پذیرش فزاینده ...

بیشتر بدانید

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
Injective با AltLayer نیروها را به هم می پیوندد تا امنیت مجدد را به inEVM بیاورد
کسب و کار گزارش خبری پیشرفته
Injective با AltLayer نیروها را به هم می پیوندد تا امنیت مجدد را به inEVM بیاورد
ممکن است 3، 2024
Masa با Teller همکاری می کند تا استخر وام MASA را معرفی کند، وام USDC را بر اساس امکان پذیر می کند
بازارها گزارش خبری پیشرفته
Masa با Teller همکاری می کند تا استخر وام MASA را معرفی کند، وام USDC را بر اساس امکان پذیر می کند
ممکن است 3، 2024
Velodrome نسخه بتا سوپرچین را در هفته‌های آینده عرضه می‌کند و در سراسر بلاک‌چین‌های OP Stack Layer 2 گسترش می‌یابد
بازارها گزارش خبری پیشرفته
Velodrome نسخه بتا سوپرچین را در هفته‌های آینده عرضه می‌کند و در سراسر بلاک‌چین‌های OP Stack Layer 2 گسترش می‌یابد
ممکن است 3، 2024
CARV شراکت با Aethir را برای تمرکززدایی لایه داده خود و توزیع جوایز اعلام می کند.
کسب و کار گزارش خبری پیشرفته
CARV شراکت با Aethir را برای تمرکززدایی لایه داده خود و توزیع جوایز اعلام می کند.
ممکن است 3، 2024
CRYPTOMERIA LABS PTE. محدود