StabilityAI oznámila AI Music Generator Harmonai založenú na modeli tanečnej difúzie
Stručne
Harmonai prináša open source audio modely, ktoré pomáhajú formovať budúcnosť hudby
Cieľom Dance Diffusion je urobiť hudobnú produkciu prístupnejšou a príjemnejšou pre každého
S Harmonai, šikovne nazvanou novou metódou, uhádli ste správne, vytvorenie zvuku z ničoho, StabilityAIVýskumníci spoločnosti urobili veľký pokrok v oblasti generovania zvuku AI. Výsledky sú ohromujúce a rôznorodé a všetky sú len trochu znepokojujúce.
Čo je Harmonai?
harmónia je komunitou riadená organizácia, ktorá vydáva generatívne zvukové nástroje s otvoreným zdrojovým kódom na zvýšenie prístupu každého k hudobnej kompozícii a potešenia z nej. Zjednodušene povedané, generuje doteraz nepočuté zvuky v procese tzv rozptyl, v ktorom sa náhodný biely šum spresňuje na zvuky na základe vopred natrénovaného modelu, ktorý obsahuje milióny parametrov, ktoré boli vypočítané počas jeho tréningového procesu, aby zapuzdrili charakteristiky zdrojového materiálu, na ktorom bol trénovaný.
Cieľom výskumného laboratória pre hlboké vzdelávanie Harmonai je vytvárať generatívne audio modely s otvoreným zdrojom, podporovať výskumníkov a vývojárov prostredníctvom výpočtového financovania a komunity a ponúkať umelcom a audio profesionálom nové kreatívne nástroje. Cieľom Harmonai je urobiť hudobnú produkciu prístupnejšou a príjemnejšou pre každého, a to vývojom open source nástrojov na syntézu a manipuláciu so zvukom.
Čo je to tanečná difúzia?
Predstaviť si Stable Diffusion namiesto obrazu produkuje iba zvuk. Tancujte Diffusion je zbierka verejne dostupných modelov generatívneho šírenia hudby. Počiatočné modely generujú 1-3 sekundy zvuku a možno ich použiť aj na interpoláciu a prenos štýlu dlhších zvukových nahrávok.
Je to teda podobné umelej inteligencii textu na obrázok pre zvuk?
V duchu, no s niektorými významnými odchýlkami. Neexistuje formulár na zadávanie textu, kde by ste mohli napísať „snare drum“ a stlačiť GO, takže toto nie je text-to-audio alebo generátor prevodu textu na reč. Samozrejme, nikdy nehovor nikdy – tento projekt je stále v ranom štádiu – ale zatiaľ je na vás, používateľovi, aby ste dodali súbor zvukových súborov (či už sú to malé bubny alebo čokoľvek, čo chcete vytvárať variácie ) na trénovanie modelu. Prípadne môžete použiť jeden zo 6 predtrénovaných modelov, ktoré sa už nachádzajú v Zápisník Dance Diffusion aby ste mohli začať – a pri hraní s nimi osamote je veľa zábavy!
Súvisí Harmonai s dadabotmi?
Áno. Harmonai je Dadaboti + viac úžasných ľudí + 4000 GPU. Na svojom kanáli YouTube už umelci Dadabots používajú hudbu generovanú AI:
Čerstvo vygenerované zvukové vzorky AI od harmónia
Sledujte komunitu discord kanál ak chcete počúvať viac zvukových súborov.
Máte záujem prečítať si viac? Tu je niekoľko ďalších noviniek, ktoré si môžete pozrieť:
Vylúčenie zodpovednosti
V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.
O autorovi
Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu.
Ďalšie článkyDamir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu.