Звіт про новини Технологія
Січень 31, 2023

MusicLM: нова модель AI для перетворення тексту в музику та зображення в музику від Google

Коротко

Google представляє MusicLM, модель для створення високоякісної музики з текстових описів.

MusicLM може бути створений як для тексту, так і для мелодії, оскільки він може трансформувати свистячі та гудливі мелодії відповідно до стилю, описаного в текстовому підписі.

Модель може створювати музику у різноманітних жанрах, включаючи класику, джаз та рок.

Google представляє MusicLM, модель для створення високоякісної музики з текстових описів, таких як «заспокійлива мелодія скрипки, підкріплена спотвореним гітарним рифом». MusicLM перетворює процес створення умовної музики як ієрархічне завдання моделювання послідовності до послідовності, і він генерує музику на 24 кГц, яка залишається постійною протягом кількох хвилин.

MusicLM: нова модель AI для перетворення тексту в музику та зображення в музику від Google

Експерименти Google показують, що MusicLM перевершує попередні системи як за якістю звуку, так і за дотриманням текстового опису. Крім того, це демонструє, що MusicLM може бути обумовлений як текстом, так і мелодією, оскільки він може трансформувати свистячі та гудливі мелодії відповідно до стилю, описаного в текстовому підписі. Щоб підтримати майбутні дослідження, ми публічно випускаємо MusicCaps, набір даних, що складається з 5.5 тисяч пар музика-текст із розширеним текстовим описом, наданим експертами.

Пов'язана стаття: Text-to-3D: Google розробив нейронну мережу, яка створює 3D-моделі з текстових описів

Модель MusicLM була навчена на великому корпусі музичних партитур, що дозволило ШІ вивчати структуру музики. Модель може створювати музику у різноманітних жанрах, включаючи класику, джаз та рок. Крім того, модель AI може створювати нові, оригінальні композиції.

Модель MusicLM є важливою розробкою в галузі музики, створеної штучним інтелектом. Ця модель є значною перевагою в порівнянні з попередніми моделями, які були обмежені коротшими музичними фрагментами або здатні генерувати лише прості мелодії. Нова модель відкриває можливість використовувати штучний інтелект для створення довгих складних музичних творів, які можна використовувати у фільмах, відеоіграх чи інших носіях.

Нова модель AI може створювати довгу музику поколінь до п'яти хвилин.

Пов'язана стаття: Stable Diffusion може створювати нову музику, генеруючи спектрограми на основі тексту

ШІ-модель може створювати музику, використовуючи титри з ігор і фільмів.

Крім того, модель ШІ може створювати музику, використовуючи зображення як вхідні дані.

Докладніше про ШІ в музичній індустрії:

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

інші статті
Дамір Ялалов
Дамір Ялалов

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Від Ripple до The Big Green DAO: як криптовалютні проекти сприяють благодійності

Давайте розглянемо ініціативи, які використовують потенціал цифрових валют для благодійних цілей.

Дізнайтеся більше

AlphaFold 3, Med-Gemini та інші: як AI трансформує охорону здоров’я у 2024 році

ШІ проявляється різними способами в охороні здоров’я, від виявлення нових генетичних кореляцій до розширення можливостей роботизованих хірургічних систем...

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
Galxe представляє L1 Blockchain «Gravity» для Omnichain досвіду та повної абстракції
Звіт про новини Технологія
Galxe представляє L1 Blockchain «Gravity» для Omnichain досвіду та повної абстракції
Травень 29, 2024
Альянс штучного суперінтелекту планує завершити злиття 13 червня
Business ринки Звіт про новини Технологія
Альянс штучного суперінтелекту планує завершити злиття 13 червня
Травень 29, 2024
Найпопулярніші децентралізовані фінанси (DeFi) Проекти на Ethereum: 5 найкращих у 2024 році
Digest Топ списки Business ринки Софтвер Технологія
Найпопулярніші децентралізовані фінанси (DeFi) Проекти на Ethereum: 5 найкращих у 2024 році
Травень 29, 2024
Мережа Aptos досягла історичного максимуму: транзакції користувачів зросли до 32,000 XNUMX TPS на фоні рекордного обсягу операцій
Думка Business ринки Софтвер Технологія
Мережа Aptos досягла історичного максимуму: транзакції користувачів зросли до 32,000 XNUMX TPS на фоні рекордного обсягу операцій
Травень 29, 2024
CRYPTOMERIA LABS PTE. LTD.