Звіт про новини Технологія
Вересень 13, 2023

Stability AI Запускає Stable Audio для створення аудіо, створеного штучним інтелектом 

Коротко

Stability AI сьогодні оголосила про запуск свого першого продукту штучного інтелекту для створення музики та звуку, Stable Audio.

Користувачі можуть вводити текстові підказки для створення звукових доріжок бажаної довжини.

Базову модель було навчено за допомогою музики та метаданих із музичної бібліотеки AudioSparx.

Stability AI, генеративна компанія ШІ Stable Diffusion, сьогодні оголосила про запуск свого першого продукту AI для створення музики та звуку, Стабільний звук. Продукт призначений для творців музики, які прагнуть створити семпли для своєї музики, а також аудіодоріжки. У компанії заявили, що користувачі можуть вводити текстові підказки для створення звукових доріжок бажаної довжини.

«Post-Rock, Guitars, Drum Kit, Bass, Strings, Euphoric, Up-Lifting, Moody, Flowing, Raw, Epic, Sentimental, 125 BPM» можна ввести із запитом на 95-секундний трек,» Stability AI написав в а блог.

Компанія також детально розповіла про те, як працює швидке створення музики у відео:

«Ми сподіваємося, що Stable Audio розширить можливості музичних ентузіастів і творчих людей професіонали генерувати новий контент за допомогою штучного інтелекту, і ми з нетерпінням чекаємо нескінченних інновацій, які він надихне», – Емад Мостаке, генеральний директор компанії Stability AI, - сказано в заяві.

За оцінками Stability AIосновну модель було навчено за допомогою музики та метаданих із музичної бібліотеки AudioSparx. Компанія стверджує, що модель Stable Audio здатна відтворювати 95 секунд стереозвуку з частотою дискретизації 44.1 кГц менш ніж за одну секунду на графічному процесорі NVIDIA A100.

Stability AI сказав, що моделі Stable Audio є моделями прихованої дифузії, що містять кілька компонентів, схожих на Stable Diffusion. Ці компоненти включають варіаційний автокодер (VAE), кодер тексту та модель умовної дифузії на основі U-Net.

Відповідно до a дослідницький звіт компанією VAE перетворює стереоаудіо в компактне, шумостійке та оборотне латентне кодування з втратами. Це кодування сприяє швидшій генерації та навчанню порівняно з безпосередньою роботою з необробленими зразками аудіо.

через Stability AI

Архітектура латентної дифузії використовує аудіодані, враховуючи текстові метадані, тривалість аудіофайлу та час початку. Цей підхід дозволяє контролювати як вміст, так і тривалість створеного аудіо. Щоб адаптувати модель до текстових підказок, аудіоплатформа використовує кодувальник замороженого тексту a CLAP модель, яка була навчена з нуля на її наборі даних.

Доступна безкоштовна версія Stable Audio з обмеженими можливостями, що дозволяє користувачам створювати та завантажувати треки тривалістю до 20 секунд. Крім того, є опція підписки «Pro», яка пропонує розширені 90-секундні треки, придатні для комерційних проектів.

Стабільне аудіо — це остання з недавньої серії продуктів AI, які Stability AI випустив. Тільки в серпні компанія випустила a Модель японської мови та Stable Chat, яка має на меті конкурувати ChatGPT.

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Сінді працює журналістом у Metaverse Post, що охоплює теми, пов’язані з web3, NFT, метавсесвіт та ШІ, зосереджуючись на інтерв’ю з Web3 гравців галузі. Вона поспілкувалася з понад 30 керівниками вищого рівня та розповіла читачам про їхні цінні ідеї. Родом із Сінгапуру, Сінді тепер живе в Тбілісі, Грузія. Вона отримала ступінь бакалавра з комунікацій та медіа-досліджень в Університеті Південної Австралії та має десятирічний досвід роботи в журналістиці та письменництві. Зв'яжіться з нею через [захищено електронною поштою] з презентаціями для преси, оголошеннями та можливостями для інтерв’ю.

інші статті
Сінді Тан
Сінді Тан

Сінді працює журналістом у Metaverse Post, що охоплює теми, пов’язані з web3, NFT, метавсесвіт та ШІ, зосереджуючись на інтерв’ю з Web3 гравців галузі. Вона поспілкувалася з понад 30 керівниками вищого рівня та розповіла читачам про їхні цінні ідеї. Родом із Сінгапуру, Сінді тепер живе в Тбілісі, Грузія. Вона отримала ступінь бакалавра з комунікацій та медіа-досліджень в Університеті Південної Австралії та має десятирічний досвід роботи в журналістиці та письменництві. Зв'яжіться з нею через [захищено електронною поштою] з презентаціями для преси, оголошеннями та можливостями для інтерв’ю.

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Від Ripple до The Big Green DAO: як криптовалютні проекти сприяють благодійності

Давайте розглянемо ініціативи, які використовують потенціал цифрових валют для благодійних цілей.

Дізнайтеся більше

AlphaFold 3, Med-Gemini та інші: як AI трансформує охорону здоров’я у 2024 році

ШІ проявляється різними способами в охороні здоров’я, від виявлення нових генетичних кореляцій до розширення можливостей роботизованих хірургічних систем...

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
Satoshi Universe представляє «Run, Linea, Run!»: поєднайте мобільні ігри та блокчейн у Runner2060. Візьміть участь у пулі винагород у розмірі 2,000 USDT!
Думка Стиль життя ринки Софтвер Технологія
Satoshi Universe представляє «Run, Linea, Run!»: поєднайте мобільні ігри та блокчейн у Runner2060. Візьміть участь у пулі винагород у розмірі 2,000 USDT!
25 Червня, 2024.
Криптобіржа Bitget запускає подію BLAST Token, пропонуючи учасникам 50,000 XNUMX доларів винагороди
ринки Звіт про новини Технологія
Криптобіржа Bitget запускає подію BLAST Token, пропонуючи учасникам 50,000 XNUMX доларів винагороди
25 Червня, 2024.
Криптобіржа ZKX залучає $6.3 млн фінансування, Airdrops його токен і розміщує його на KuCoin, Gate.io та Bitget
Business Звіт про новини Технологія
Криптобіржа ZKX залучає $6.3 млн фінансування, Airdrops його токен і розміщує його на KuCoin, Gate.io та Bitget
25 Червня, 2024.
Токенізовані RWA долають розрив між ними DeFi і TradFi
Думка Топ списки Business ринки Софтвер Технологія
Токенізовані RWA долають розрив між ними DeFi і TradFi
24 Червня, 2024.
CRYPTOMERIA LABS PTE. LTD.