Звіт про новини
Жовтень 21, 2022

Google AI анонсувала перший в історії генератор тексту в музику AudioLM

Коротко

AudioLM може створювати музику, просто слухаючи звуки

Муберт ШІ продовжить людську мову та фортепіанну музику

з GPT-3 та інші, ідея генеративного ШІ має хороші шанси просунутися вперед. Ми також відкрили поняття inpainting і outpainting; ШІ вміло завершує зображення, зберігаючи тему та стиль. А як щодо музики?

І ще раз! Оскільки все це базується на мовних моделях штучного інтелекту, які зберігають значення, було лише питанням часу, коли цю технологію можна буде застосувати до музики. І ось час настав.

Google AI анонсувала перший в історії генератор тексту в музику AudioLM

Згідно з нещодавнім дослідженням Google, нову структуру для аудіовиробництва під назвою AudioLM можна навчити створювати реалістичну мову та фортепіанну музику, просто прослуховуючи звуки. Завдяки довгостроковій стабільності та чудовій точності AudioLM перевершує попередні системи та вдосконалює створення аудіо за допомогою додатків для синтезу голосу та комп’ютерної музики.

Ми розробили систему для розпізнавання синтетичних звуків, створених AudioLM, використовуючи ті самі концепції ШІ, які лежали в основі створення наших попередніх моделей.

AudioLM ШІ від Google може подовжити акустичний пасаж, зберігаючи «намір». На даний момент його навчено продовжувати людську мову та фортепіанну музику на основі обмеженої вибірки вхідних даних. Перевірте зразок нижче.

Критерії мовлення були простими: слухачів просили оцінити, чи продовження звучало як людська мова. З музикою було виявлено, що «продовження» розділу, наданого для введення, набагато кращі за якістю, ніж усі поточні музичні генератори з нуля, такі як музичний автомат. З пропозицією на вході ШІ продовжує музику значно краще.

Google AI анонсувала перший в історії генератор тексту в музику AudioLM

Людські оцінювачі прослухали зразки аудіо, щоб підтвердити результати. Вони визначили, чи чують вони справжній продовження людського голосу, який був записаний, чи штучний голос, створений AudioLM. Їхні дані вказують на 51.2% успіху. У результаті пересічному слухачеві буде складно відрізнити мову, створену AudioLM, від справжньої людської мови.

Чи змінює технологія перетворення тексту в музику музичний бізнес?

Генератор тексту в музику на основі Mubert API була нещодавно оголошена іншою моделлю AI, Mubert. Mubert створює різні звуки для кожного запиту, який ви надсилаєте. Імовірність повторення дійсно мала. Музика створюється за запитом; він не витягується з бази готових мелодій. Як по-справжньому генеративна ця музика це поширене запитання.

Чи змінює технологія перетворення тексту в музику музичний бізнес?

Звуки вибираються перед створенням. І підказка введення, і теги Mubert API закодовані у вектор латентного простору трансформаторної нейронної мережі. Потім вибирається найближчий вектор тегів для кожного запиту, а супровідні теги передаються в наш API для створення музики. Жодна нейронна мережа не використовувалася для побудови будь-яких звуків (окремі петлі для баса, солів тощо); всі звуки створені музикантами та звукорежисерами.

Наступний важливий крок Муберта — взяти елементи з поточного світу, такі як фотографії, фільми, сценарії та презентації, і створити музику світу навколо вас.

Ось що ви можете отримати, необачно вкладаючи текстові підказки в уста музичного Муберта ШІ:

Це початковий етап у процесі побудови більш складного та точного алгоритму генерації, але це потребує часу та грошей.

Однак технологія перетворення тексту в музику вже доступна, тому ви можете генерувати альбоми масово, вимкнувши «підказку введення» на «написати сценарій випадкової підказки». Здається, художники більше не потрібні.

Читайте більше схожих новин:

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

інші статті
Дамір Ялалов
Дамір Ялалов

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Інституційний апетит зростає до біткойн ETF на тлі волатильності

Розкриття інформації через документи 13F свідчить про те, що відомі інституційні інвестори займаються біткойн ETF, підкреслюючи зростаюче визнання ...

Дізнайтеся більше

Настав день винесення вироку: суд США розглядає прохання Міністерства юстиції щодо долі CZ.

Changpeng Zhao готовий зіткнутися з вироком у американському суді в Сіетлі сьогодні.

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
Injective об’єднує зусилля з AltLayer, щоб перенести безпеку в inEVM
Business Звіт про новини Технологія
Injective об’єднує зусилля з AltLayer, щоб перенести безпеку в inEVM
Травень 3, 2024
Masa об’єднується з Teller, щоб представити MASA Lending Pool, що дає можливість USDC запозичувати на базі
ринки Звіт про новини Технологія
Masa об’єднується з Teller, щоб представити MASA Lending Pool, що дає можливість USDC запозичувати на базі
Травень 3, 2024
Найближчими тижнями Velodrome запускає бета-версію Superchain і розповсюджується на блокчейни рівня 2 OP Stack
ринки Звіт про новини Технологія
Найближчими тижнями Velodrome запускає бета-версію Superchain і розповсюджується на блокчейни рівня 2 OP Stack
Травень 3, 2024
CARV оголошує про партнерство з Aethir для децентралізації рівня даних і розподілу винагород
Business Звіт про новини Технологія
CARV оголошує про партнерство з Aethir для децентралізації рівня даних і розподілу винагород
Травень 3, 2024
CRYPTOMERIA LABS PTE. LTD.