Novinová správa
Októbra 21, 2022

Umelá inteligencia Google ohlásila vôbec prvý generátor prevodu textu na hudbu AudioLM

Stručne

AudioLM dokáže produkovať hudbu len počúvaním zvukov

Mubert AI pokračovať v ľudskej reči a klavírnej hudbe

s GPT-3 a iní, myšlienka generatívnej AI má dobrú šancu posunúť sa vpred. Objavili sme tiež koncepty maľby a maľby; AI šikovne dotvára obrázky pri zachovaní témy a štýlu. A čo hudba?

A ešte raz! Keďže toto všetko je založené na jazykových modeloch AI, ktoré si zachovávajú význam, bolo len otázkou času, kedy sa táto technológia uplatní aj v hudbe. A teraz prišiel ten čas.

Google AI oznámil vôbec prvý generátor prevodu textu na hudbu AudioLM

Podľa nedávneho výskumu spoločnosti Google je možné nový rámec pre produkciu zvuku s názvom AudioLM naučiť vytvárať realistickú reč a klavírnu hudbu jednoducho počúvaním zvukov. Vďaka svojej dlhodobej konzistencii a vynikajúcej vernosti AudioLM prekonáva staršie systémy a posúva tvorbu zvuku pomocou aplikácií v oblasti hlasovej syntézy a počítačom podporovanej hudby.

Vyvinuli sme systém na rozpoznávanie syntetických zvukov produkovaných AudioLM pomocou rovnakých konceptov AI, ktoré boli základom pri tvorbe našich predchádzajúcich modelov.

AudioLM od Google AI dokáže predĺžiť akustickú pasáž a zároveň zachovať „zámer“. Odteraz bol trénovaný na pokračovanie ľudskej reči a klavírnej hudby na základe obmedzenej vzorky vstupných údajov. Skontrolujte vzorku nižšie.

Kritériá reči boli jednoduché: Poslucháči mali posúdiť, či pokračovanie znie ako ľudská reč. Pri hudbe sa zistilo, že „pokračovanie“ sekcie dodávanej pre vstup je kvalitou oveľa kvalitnejšie ako všetky súčasné hudobné generátory od nuly, ako napr. JukeBox. S návrhom na vstupe AI pokračuje v hudbe podstatne lepšie.

Google AI oznámil vôbec prvý generátor prevodu textu na hudbu AudioLM

Ľudskí hodnotitelia si vypočuli zvukové ukážky, aby potvrdili výsledky. Zisťovali, či počujú skutočné pokračovanie ľudského hlasu, ktorý bol nahraný, alebo umelý hlas produkovaný AudioLM. Ich údaje uvádzajú 51.2% úspešnosť. V dôsledku toho bude pre priemerného poslucháča náročné rozlíšiť medzi rečou produkovanou AudioLM a skutočnou ľudskou rečou.

Mení technológia prevodu textu na hudbu hudobný biznis?

Generátor prevodu textu na hudbu založený na Mubert API bol nedávno ohlásený ďalším modelom AI, Mubertom. Mubert vytvára inú sadu zvukov pre každú odoslanú požiadavku. Pravdepodobnosť opakovania je skutočne mizivá. Hudba sa vytvára, keď je podaná žiadosť; nevyberá sa z databázy hotových melódií. Ako naozaj generatívnu túto hudbu je bežná otázka.

Mení technológia prevodu textu na hudbu hudobný biznis?

Zvuky sa vyberajú pred vytvorením. Vstupná výzva aj značky Mubert API sú zakódované do latentného priestorového vektora transformátorovej neurónovej siete. Potom sa vyberie najbližší vektor tagov pre každý dotaz a sprievodné tagy sa prenesú do nášho API na vytvorenie hudby. Na zostavenie žiadneho zo zvukov nebola použitá žiadna neurónová sieť (samostatné slučky pre basy, zvody atď.); všetky zvuky produkovali hudobníci a zvukoví dizajnéri.

Ďalším významným krokom Muberta je vziať položky zo súčasného sveta, ako sú fotografie, filmy, scenáre a prezentácie, a vytvoriť hudbu zo sveta okolo vás.

Tu je to, čo môžete získať bezohľadným vkladaním textových výziev do úst muzikálu Mubert AI:

Toto je počiatočná fáza v procese budovania sofistikovanejšieho a presnejšieho generujúceho algoritmu, ale bude to vyžadovať čas a peniaze.

Technológia prevodu textu na hudbu je však už k dispozícii, takže môžete hromadne generovať albumy tak, že prepnete „výzvu na zadanie“ na „napíšte náhodný skript výzvy“. Zdá sa, že umelci už nie sú potrební.

Prečítajte si ďalšie súvisiace novinky:

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Ďalšie články
Damir Yalalov
Damir Yalalov

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Inštitucionálny apetít rastie smerom k bitcoinovým ETF uprostred volatility

Zverejnenia prostredníctvom podaní 13F odhaľujú pozoruhodných inštitucionálnych investorov, ktorí sa venujú bitcoinovým ETF, čo podčiarkuje rastúcu akceptáciu ...

vedieť viac

Prichádza deň odsúdenia: Osud CZ visí v rovnováhe, pretože americký súd zvažuje žalobu ministerstva spravodlivosti

Changpeng Zhao dnes čaká na americkom súde v Seattli odsúdenie.

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
Injective spája svoje sily s AltLayer, aby priniesla bezpečnosť pri prestavbe inEVM
firmy Novinová správa Technológia
Injective spája svoje sily s AltLayer, aby priniesla bezpečnosť pri prestavbe inEVM
Môže 3, 2024
Masa sa spojila so spoločnosťou Teller, aby predstavila fond pôžičiek MASA a umožnila požičiavanie USDC na základni
trhy Novinová správa Technológia
Masa sa spojila so spoločnosťou Teller, aby predstavila fond pôžičiek MASA a umožnila požičiavanie USDC na základni
Môže 3, 2024
Velodrome uvádza na trh beta verziu Superchain v najbližších týždňoch a rozširuje sa o blockchainy OP Stack Layer 2
trhy Novinová správa Technológia
Velodrome uvádza na trh beta verziu Superchain v najbližších týždňoch a rozširuje sa o blockchainy OP Stack Layer 2
Môže 3, 2024
CARV oznamuje partnerstvo so spoločnosťou Aethir s cieľom decentralizovať svoju dátovú vrstvu a distribuovať odmeny
firmy Novinová správa Technológia
CARV oznamuje partnerstvo so spoločnosťou Aethir s cieľom decentralizovať svoju dátovú vrstvu a distribuovať odmeny
Môže 3, 2024
CRYPTOMERIA LABS PTE. LTD.