Novinky
Října 21, 2022

Umělá inteligence Google oznámila vůbec první generátor textu na hudbu AudioLM

Stručně

AudioLM dokáže produkovat hudbu pouhým posloucháním zvuků

Mubert AI pokračovat v lidské řeči a klavírní hudbě

S GPT-3 a další, myšlenka generativní umělé inteligence má dobrou šanci pohnout se vpřed. Objevili jsme také pojmy malba a malba; Umělá inteligence dovedně doplňuje obrázky při zachování tématu a stylu. a co hudba?

A ještě jednou! Vzhledem k tomu, že toto vše je založeno na modelech jazyků AI, které si zachovávají význam, bylo jen otázkou času, kdy bude tato technologie aplikována na hudbu. A teď nadešel čas.

Google AI oznámil vůbec první generátor převodu textu na hudbu AudioLM

Podle nedávného výzkumu Google lze nový rámec pro produkci zvuku nazvaný AudioLM naučit vytvářet realistickou řeč a klavírní hudbu pouhým poslechem zvuků. Díky své dlouhodobé konzistenci a vynikající věrnosti předčí AudioLM dřívější systémy a posouvá tvorbu zvuku pomocí aplikací v hlasové syntéze a hudbě podporované počítačem.

Vyvinuli jsme systém pro rozpoznávání syntetických zvuků produkovaných AudioLM pomocí stejných konceptů umělé inteligence, které byly základem tvorby našich předchozích modelů.

AudioLM od Google AI může rozšířit akustickou pasáž a zároveň zachovat „záměr“. Od této chvíle byl trénován na pokračování lidské řeči a klavírní hudby na základě omezeného vzorku vstupních dat. Zkontrolujte ukázku níže.

Kritéria pro řeč byla jasná: Posluchači byli požádáni, aby posoudili, zda pokračování zní jako lidská řeč. S hudbou bylo zjištěno, že „pokračování“ sekce dodávané pro vstup je kvalitou mnohem lepší než všechny současné hudební generátory od nuly, jako např. Hudební automat. S návrhem na vstupu pokračuje AI v hudbě podstatně lépe.

Google AI oznámil vůbec první generátor převodu textu na hudbu AudioLM

Lidští hodnotitelé poslouchali zvukové ukázky, aby potvrdili výsledky. Zjišťovali, zda slyší skutečné pokračování lidského hlasu, který byl zaznamenán, nebo umělý hlas produkovaný AudioLM. Jejich data udávají 51.2% úspěšnost. V důsledku toho bude pro průměrného posluchače náročné rozlišit mezi řečí produkovanou AudioLM a skutečnou lidskou řečí.

Mění technologie převodu textu na hudbu hudební byznys?

Generátor převodu textu na hudbu založený na Mubert API byl nedávno oznámen dalším modelem AI, Mubertem. Mubert vytváří jinou sadu zvuků pro každý požadavek, který odešlete. Pravděpodobnost opakování je opravdu mizivá. Hudba je vytvořena, když je učiněn požadavek; není vytahován z databáze hotových skladeb. Jak skutečně generativní tato hudba je častá otázka.

Mění technologie převodu textu na hudbu hudební byznys?

Zvuky se vybírají před vytvořením. Jak vstupní výzva, tak tagy Mubert API jsou zakódovány do latentního prostorového vektoru transformátorové neuronové sítě. Poté se vybere nejbližší vektor tagů pro každý dotaz a doprovodné tagy se přenesou do našeho API, aby se vytvořila hudba. Ke konstrukci žádného ze zvuků nebyla použita žádná neuronová síť (samostatné smyčky pro basy, svody atd.); všechny zvuky byly produkovány hudebníky a zvukovými designéry.

Mubertovým dalším významným krokem je vzít položky ze současného světa, jako jsou fotografie, filmy, scénáře a prezentace, a vytvořit hudbu ze světa kolem vás.

Zde je to, co můžete získat neuváženým vložením textových výzev do úst muzikálu Mubert AI:

Toto je počáteční fáze procesu budování sofistikovanějšího a přesnějšího generujícího algoritmu, ale bude to vyžadovat čas a peníze.

Technologie převodu textu na hudbu je však již k dispozici, takže můžete hromadně generovat alba tím, že přepnete „input prompt“ na „write a random prompt script“. Zdá se, že umělci už nejsou potřeba.

Přečtěte si další související novinky:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Injective spojuje síly s AltLayer, aby přineslo zabezpečení při opětovném skládání do inEVM
Business Novinky Technika
Injective spojuje síly s AltLayer, aby přineslo zabezpečení při opětovném skládání do inEVM
3
Masa se spojila s Tellerem, aby zavedla MASA Půjčovací fond, umožní USDC půjčování na základně
Trhy Novinky Technika
Masa se spojila s Tellerem, aby zavedla MASA Půjčovací fond, umožní USDC půjčování na základně
3
Velodrome spouští v nadcházejících týdnech beta verzi Superchain a rozšiřuje se o blockchainy OP Stack Layer 2
Trhy Novinky Technika
Velodrome spouští v nadcházejících týdnech beta verzi Superchain a rozšiřuje se o blockchainy OP Stack Layer 2
3
CARV oznamuje partnerství se společností Aethir za účelem decentralizace její datové vrstvy a distribuce odměn
Business Novinky Technika
CARV oznamuje partnerství se společností Aethir za účelem decentralizace její datové vrstvy a distribuce odměn
3
CRYPTOMERIA LABS PTE. LTD.