StabilityAI ogłosił AI Music Generator Harmonai w oparciu o Dance Diffusion Model
W skrócie
Harmonai udostępnia modele audio typu open source, aby pomóc kształtować przyszłość muzyki
Dance Diffusion ma na celu uczynienie produkcji muzycznej bardziej przystępną i przyjemną dla każdego
Dzięki Harmonai, sprytnie nazwanej nowej metodzie, jak zgadłeś, tworzenia dźwięku z niczego, StabilityAINaukowcy z firmy poczynili duże postępy w dziedzinie generowania dźwięku przez sztuczną inteligencję. Wyniki są zdumiewające i różnorodne, a wszystkie są po prostu trochę niepokojące.
Co to jest Harmonai?
Harmony to organizacja kierowana przez społeczność, która publikuje generatywne narzędzia audio o otwartym kodzie źródłowym, aby zwiększyć dostęp wszystkich do kompozycji muzycznej i przyjemność z niej czerpać. Mówiąc prościej, generuje on nigdy wcześniej nie słyszane dźwięki w procesie zwanym dyfuzja, w którym losowy biały szum jest przetwarzany na dźwięki na podstawie wstępnie wytrenowanego modelu zawierającego miliony parametrów obliczonych podczas procesu uczenia w celu zawarcia cech materiału źródłowego, na którym został przeszkolony.
Celem laboratorium badawczego głębokiego uczenia się Harmonai jest tworzenie generatywnych modeli audio typu open source, wspieranie badaczy i programistów poprzez finansowanie obliczeniowe i społeczność oraz oferowanie nowych kreatywnych narzędzi artystom i profesjonalistom audio. Celem Harmonai jest uczynienie produkcji muzycznej bardziej przystępną i przyjemną dla każdego poprzez opracowanie otwartych narzędzi do syntezy i manipulacji dźwiękiem.
Co to jest dyfuzja tańca?
Imagine Stable Diffusion wytwarza jedynie dźwięk zamiast obrazu. Taniec Diffusion to zbiór publicznie dostępnych modeli generatywnego rozpowszechniania muzyki. Początkowe modele generują 1–3 sekundy dźwięku i można ich również używać do interpolacji i przesyłania stylu dłuższych nagrań audio.
Czy jest zatem podobny do sztucznej inteligencji przekształcającej tekst w obraz dla dźwięku?
W duchu, choć z pewnymi znaczącymi różnicami. Nie ma formularza do wprowadzania tekstu, w którym można wpisać „werbel” i nacisnąć GO, zatem nie jest to formularz zamiana tekstu na dźwięk lub generator zamiany tekstu na mowę. Oczywiście nigdy nie mów nigdy — ten projekt jest wciąż w początkowej fazie — ale na razie od Ciebie, użytkownika, zależy dostarczenie puli plików audio (czy to werble, czy cokolwiek innego, co chcesz wygenerować wariacje ), aby wytrenować model. Alternatywnie możesz skorzystać z jednego z 6 wstępnie wytrenowanych modeli, które są już obecne w Notatnik Dance Difusion na dobry początek — a granie z nimi w pojedynkę to mnóstwo zabawy!
Czy Harmonai jest spokrewniony z Dadabotami?
Tak. Harmonai jest Dadaboty + więcej niesamowitych ludzi + 4000 procesorów graficznych. Na swoim kanale YouTube artyści Dadabots wykorzystują już muzykę generowaną przez sztuczną inteligencję:
Świeżo wygenerowane próbki audio AI autorstwa Harmony
Śledź społeczność kanał niezgody aby odsłuchać więcej plików audio.
Chcesz przeczytać więcej? Oto kilka dodatkowych wiadomości do sprawdzenia:
Odpowiedzialność
Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.
O autorze
Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.
Więcej artykułówDamir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.