Novinová správa
Októbra 03, 2022

StabilityAI oznámila AI Music Generator Harmonai založenú na modeli tanečnej difúzie

Stručne

Harmonai prináša open source audio modely, ktoré pomáhajú formovať budúcnosť hudby

Cieľom Dance Diffusion je urobiť hudobnú produkciu prístupnejšou a príjemnejšou pre každého

S Harmonai, šikovne nazvanou novou metódou, uhádli ste správne, vytvorenie zvuku z ničoho, StabilityAIVýskumníci spoločnosti urobili veľký pokrok v oblasti generovania zvuku AI. Výsledky sú ohromujúce a rôznorodé a všetky sú len trochu znepokojujúce.

StabilityAI oznámila AI Music Generator Harmonai založenú na modeli tanečnej difúzie
Obrázok vygenerovaný používateľom Stable Diffusion

Čo je Harmonai?

harmónia je komunitou riadená organizácia, ktorá vydáva generatívne zvukové nástroje s otvoreným zdrojovým kódom na zvýšenie prístupu každého k hudobnej kompozícii a potešenia z nej. Zjednodušene povedané, generuje doteraz nepočuté zvuky v procese tzv rozptyl, v ktorom sa náhodný biely šum spresňuje na zvuky na základe vopred natrénovaného modelu, ktorý obsahuje milióny parametrov, ktoré boli vypočítané počas jeho tréningového procesu, aby zapuzdrili charakteristiky zdrojového materiálu, na ktorom bol trénovaný.

Cieľom výskumného laboratória pre hlboké vzdelávanie Harmonai je vytvárať generatívne audio modely s otvoreným zdrojom, podporovať výskumníkov a vývojárov prostredníctvom výpočtového financovania a komunity a ponúkať umelcom a audio profesionálom nové kreatívne nástroje. Cieľom Harmonai je urobiť hudobnú produkciu prístupnejšou a príjemnejšou pre každého, a to vývojom open source nástrojov na syntézu a manipuláciu so zvukom.

Čo je to tanečná difúzia?

Predstaviť si Stable Diffusion namiesto obrazu produkuje iba zvuk. Tancujte Diffusion je zbierka verejne dostupných modelov generatívneho šírenia hudby. Počiatočné modely generujú 1-3 sekundy zvuku a možno ich použiť aj na interpoláciu a prenos štýlu dlhších zvukových nahrávok.

Je to teda podobné umelej inteligencii textu na obrázok pre zvuk?

V duchu, no s niektorými významnými odchýlkami. Neexistuje formulár na zadávanie textu, kde by ste mohli napísať „snare drum“ a stlačiť GO, takže toto nie je text-to-audio alebo generátor prevodu textu na reč. Samozrejme, nikdy nehovor nikdy – tento projekt je stále v ranom štádiu – ale zatiaľ je na vás, používateľovi, aby ste dodali súbor zvukových súborov (či už sú to malé bubny alebo čokoľvek, čo chcete vytvárať variácie ) na trénovanie modelu. Prípadne môžete použiť jeden zo 6 predtrénovaných modelov, ktoré sa už nachádzajú v Zápisník Dance Diffusion aby ste mohli začať – a pri hraní s nimi osamote je veľa zábavy!

Áno. Harmonai je Dadaboti + viac úžasných ľudí + 4000 GPU. Na svojom kanáli YouTube už umelci Dadabots používajú hudbu generovanú AI:

Čerstvo vygenerované zvukové vzorky AI od harmónia

Sledujte komunitu discord kanál ak chcete počúvať viac zvukových súborov.

Máte záujem prečítať si viac? Tu je niekoľko ďalších noviniek, ktoré si môžete pozrieť:

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Ďalšie články
Damir Yalalov
Damir Yalalov

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Prichádza deň odsúdenia: Osud CZ visí v rovnováhe, pretože americký súd zvažuje žalobu ministerstva spravodlivosti

Changpeng Zhao dnes čaká na americkom súde v Seattli odsúdenie.

vedieť viac

Zakladatelia Peňaženky Samourai boli obvinení z uľahčenia obchodov Darknet v hodnote 2 miliárd USD

Obavy zakladateľov Peňaženky Samourai predstavujú pre odvetvie pozoruhodnú prekážku, ktorá podčiarkuje pretrvávajúcu ...

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
Apríl 2024 zaznamenal historické minimum hackingov a podvodov, CertiK hlási 141 % pokles oproti marcu
trhy zabezpečenia Wiki Príbehy a recenzie Technológia
Apríl 2024 zaznamenal historické minimum hackingov a podvodov, CertiK hlási 141 % pokles oproti marcu
Môže 1, 2024
Cena bitcoinu klesla pred oznámením rozhodnutia Federálneho rezervného systému o úrokových sadzbách, analytici varujú pred možným posunom na trhu
trhy Novinová správa Technológia
Cena bitcoinu klesla pred oznámením rozhodnutia Federálneho rezervného systému o úrokových sadzbách, analytici varujú pred možným posunom na trhu
Môže 1, 2024
PlayFi integruje MultiversX pre Plug-and-Play Web3 Zážitok z hry
firmy Novinová správa Technológia
PlayFi integruje MultiversX pre Plug-and-Play Web3 Zážitok z hry
Môže 1, 2024
Galxe predstavuje Passport V2 s vylepšenými nástrojmi na ochranu súkromia a overovanie Web3
Novinová správa Technológia
Galxe predstavuje Passport V2 s vylepšenými nástrojmi na ochranu súkromia a overovanie Web3
Apríla 30, 2024
CRYPTOMERIA LABS PTE. LTD.