Umělá inteligence Google oznámila vůbec první generátor textu na hudbu AudioLM
Stručně
AudioLM dokáže produkovat hudbu pouhým posloucháním zvuků
Mubert AI pokračovat v lidské řeči a klavírní hudbě
S GPT-3 a další, myšlenka generativní umělé inteligence má dobrou šanci pohnout se vpřed. Objevili jsme také pojmy malba a malba; Umělá inteligence dovedně doplňuje obrázky při zachování tématu a stylu. a co hudba?
A ještě jednou! Vzhledem k tomu, že toto vše je založeno na modelech jazyků AI, které si zachovávají význam, bylo jen otázkou času, kdy bude tato technologie aplikována na hudbu. A teď nadešel čas.
Podle nedávného výzkumu Google lze nový rámec pro produkci zvuku nazvaný AudioLM naučit vytvářet realistickou řeč a klavírní hudbu pouhým poslechem zvuků. Díky své dlouhodobé konzistenci a vynikající věrnosti předčí AudioLM dřívější systémy a posouvá tvorbu zvuku pomocí aplikací v hlasové syntéze a hudbě podporované počítačem.
AudioLM od Google AI může rozšířit akustickou pasáž a zároveň zachovat „záměr“. Od této chvíle byl trénován na pokračování lidské řeči a klavírní hudby na základě omezeného vzorku vstupních dat. Zkontrolujte ukázku níže.
Kritéria pro řeč byla jasná: Posluchači byli požádáni, aby posoudili, zda pokračování zní jako lidská řeč. S hudbou bylo zjištěno, že „pokračování“ sekce dodávané pro vstup je kvalitou mnohem lepší než všechny současné hudební generátory od nuly, jako např. Hudební automat. S návrhem na vstupu pokračuje AI v hudbě podstatně lépe.
Lidští hodnotitelé poslouchali zvukové ukázky, aby potvrdili výsledky. Zjišťovali, zda slyší skutečné pokračování lidského hlasu, který byl zaznamenán, nebo umělý hlas produkovaný AudioLM. Jejich data udávají 51.2% úspěšnost. V důsledku toho bude pro průměrného posluchače náročné rozlišit mezi řečí produkovanou AudioLM a skutečnou lidskou řečí.
Mění technologie převodu textu na hudbu hudební byznys?
Generátor převodu textu na hudbu založený na Mubert API byl nedávno oznámen dalším modelem AI, Mubertem. Mubert vytváří jinou sadu zvuků pro každý požadavek, který odešlete. Pravděpodobnost opakování je opravdu mizivá. Hudba je vytvořena, když je učiněn požadavek; není vytahován z databáze hotových skladeb. Jak skutečně generativní tato hudba je častá otázka.
Zvuky se vybírají před vytvořením. Jak vstupní výzva, tak tagy Mubert API jsou zakódovány do latentního prostorového vektoru transformátorové neuronové sítě. Poté se vybere nejbližší vektor tagů pro každý dotaz a doprovodné tagy se přenesou do našeho API, aby se vytvořila hudba. Ke konstrukci žádného ze zvuků nebyla použita žádná neuronová síť (samostatné smyčky pro basy, svody atd.); všechny zvuky byly produkovány hudebníky a zvukovými designéry.
Mubertovým dalším významným krokem je vzít položky ze současného světa, jako jsou fotografie, filmy, scénáře a prezentace, a vytvořit hudbu ze světa kolem vás.
Zde je to, co můžete získat neuváženým vložením textových výzev do úst muzikálu Mubert AI:
Toto je počáteční fáze procesu budování sofistikovanějšího a přesnějšího generujícího algoritmu, ale bude to vyžadovat čas a peníze.
Technologie převodu textu na hudbu je však již k dispozici, takže můžete hromadně generovat alba tím, že přepnete „input prompt“ na „write a random prompt script“. Zdá se, že umělci už nejsou potřeba.
Přečtěte si další související novinky:
Odmítnutí odpovědnosti
V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.
O autorovi
Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu.
Další článkyDamir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu.