Raport aktualności
03 października 2022 r.

StabilityAI ogłosił AI Music Generator Harmonai w oparciu o Dance Diffusion Model

W skrócie

Harmonai udostępnia modele audio typu open source, aby pomóc kształtować przyszłość muzyki

Dance Diffusion ma na celu uczynienie produkcji muzycznej bardziej przystępną i przyjemną dla każdego

Dzięki Harmonai, sprytnie nazwanej nowej metodzie, jak zgadłeś, tworzenia dźwięku z niczego, StabilityAINaukowcy z firmy poczynili duże postępy w dziedzinie generowania dźwięku przez sztuczną inteligencję. Wyniki są zdumiewające i różnorodne, a wszystkie są po prostu trochę niepokojące.

StabilityAI ogłosił AI Music Generator Harmonai w oparciu o Dance Diffusion Model
Obraz wygenerowany przez Stable Diffusion

Co to jest Harmonai?

Harmony to organizacja kierowana przez społeczność, która publikuje generatywne narzędzia audio o otwartym kodzie źródłowym, aby zwiększyć dostęp wszystkich do kompozycji muzycznej i przyjemność z niej czerpać. Mówiąc prościej, generuje on nigdy wcześniej nie słyszane dźwięki w procesie zwanym dyfuzja, w którym losowy biały szum jest przetwarzany na dźwięki na podstawie wstępnie wytrenowanego modelu zawierającego miliony parametrów obliczonych podczas procesu uczenia w celu zawarcia cech materiału źródłowego, na którym został przeszkolony.

Celem laboratorium badawczego głębokiego uczenia się Harmonai jest tworzenie generatywnych modeli audio typu open source, wspieranie badaczy i programistów poprzez finansowanie obliczeniowe i społeczność oraz oferowanie nowych kreatywnych narzędzi artystom i profesjonalistom audio. Celem Harmonai jest uczynienie produkcji muzycznej bardziej przystępną i przyjemną dla każdego poprzez opracowanie otwartych narzędzi do syntezy i manipulacji dźwiękiem.

Co to jest dyfuzja tańca?

Imagine Stable Diffusion wytwarza jedynie dźwięk zamiast obrazu. Taniec Diffusion to zbiór publicznie dostępnych modeli generatywnego rozpowszechniania muzyki. Początkowe modele generują 1–3 sekundy dźwięku i można ich również używać do interpolacji i przesyłania stylu dłuższych nagrań audio.

Czy jest zatem podobny do sztucznej inteligencji przekształcającej tekst w obraz dla dźwięku?

W duchu, choć z pewnymi znaczącymi różnicami. Nie ma formularza do wprowadzania tekstu, w którym można wpisać „werbel” i nacisnąć GO, zatem nie jest to formularz zamiana tekstu na dźwięk lub generator zamiany tekstu na mowę. Oczywiście nigdy nie mów nigdy — ten projekt jest wciąż w początkowej fazie — ale na razie od Ciebie, użytkownika, zależy dostarczenie puli plików audio (czy to werble, czy cokolwiek innego, co chcesz wygenerować wariacje ), aby wytrenować model. Alternatywnie możesz skorzystać z jednego z 6 wstępnie wytrenowanych modeli, które są już obecne w Notatnik Dance Difusion na dobry początek — a granie z nimi w pojedynkę to mnóstwo zabawy!

Tak. Harmonai jest Dadaboty + więcej niesamowitych ludzi + 4000 procesorów graficznych. Na swoim kanale YouTube artyści Dadabots wykorzystują już muzykę generowaną przez sztuczną inteligencję:

Świeżo wygenerowane próbki audio AI autorstwa Harmony

Śledź społeczność kanał niezgody aby odsłuchać więcej plików audio.

Chcesz przeczytać więcej? Oto kilka dodatkowych wiadomości do sprawdzenia:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Więcej artykułów
Damir Jałałow
Damir Jałałow

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Nadchodzi dzień wyroku: los CZ wisi na włosku, gdy amerykański sąd rozpatruje skargę Departamentu Sprawiedliwości

Changpeng Zhao stanie dziś przed amerykańskim sądem w Seattle wyrokiem skazującym.

Dowiedz się więcej

Założyciele portfela Samourai oskarżeni o ułatwianie transakcji o wartości 2 miliardów dolarów w Darknet

Zaniepokojenie założycieli Samourai Wallet stanowi wyraźną porażkę dla branży, podkreślając utrzymujące się...

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
W kwietniu 2024 r. odnotowano historycznie niski poziom hacków i oszustw, CertiK raportuje 141% spadek w porównaniu z marcem
rynki Bezpieczeństwo Wiki Historie i recenzje Technologia
W kwietniu 2024 r. odnotowano historycznie niski poziom hacków i oszustw, CertiK raportuje 141% spadek w porównaniu z marcem
1 maja 2024 r.
Cena Bitcoina spada przed ogłoszeniem decyzji Rezerwy Federalnej w sprawie stóp procentowych, analitycy ostrzegają przed potencjalną zmianą rynku
rynki Raport aktualności Technologia
Cena Bitcoina spada przed ogłoszeniem decyzji Rezerwy Federalnej w sprawie stóp procentowych, analitycy ostrzegają przed potencjalną zmianą rynku
1 maja 2024 r.
PlayFi integruje MultiversX w trybie Plug-And-Play Web3 Doświadczenie w grach
Biznes Raport aktualności Technologia
PlayFi integruje MultiversX w trybie Plug-And-Play Web3 Doświadczenie w grach
1 maja 2024 r.
Galxe wprowadza usługę Passport V2 z ulepszonymi narzędziami do ochrony prywatności i weryfikacji Web3
Raport aktualności Technologia
Galxe wprowadza usługę Passport V2 z ulepszonymi narzędziami do ochrony prywatności i weryfikacji Web3
30 kwietnia 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.