Novinky Technika
Února 08, 2023

Gen-1: AI generuje nová videa ze stávajících tím, že kombinuje výzvy a obrázky

Stručně

Gen-1 je neuronová síť, která dokáže generovat nová videa ze stávajících kombinací výzvy a obrázky.

Dalo by se také použít k vytvoření zcela nových videí od začátku.

Možnost generovat nová videa ze stávajících má řadu potenciálních aplikací.

RunWayML, startup s umělou inteligencí, oznámila nový produkt s názvem Gen-1, neuronová síť, která dokáže generovat nová videa ze stávajících tím, že kombinuje výzvy a obrázky. Po léta se neuronové sítě omezovaly na přenos stylu, což je proces pořízení obrázku a aplikování stylu jiného obrázku na něj. Tak získáme ta trippy videa s hlubokým učením, kde je například krajina vykreslena ve stylu Van Goghovy Hvězdné noci.

Gen-1: AI generuje nová videa ze stávajících tím, že kombinuje výzvy a obrázky
@Midjourney / Ten divný duch

Nyní, s Gen-1, mohou neuronové sítě dělat více než jen přenos stylu. Může generovat nová videa od nuly pomocí výzev a obrázků jako vstupu. To otevírá zcela nové možnosti pro Videa vytvořená umělou inteligencí. Právě teď jsou videa generovaná Gen-1 krátká a jednoduchá. Ale jak se technologie vyvíjí, můžeme očekávat, že uvidíme složitější a realistická videa generovaná umělou inteligencí.

Doporučený příspěvek: Sledováním videí pro dospělé ve virtuální realitě se zlepšuje reprodukční zdraví mužů

Co je Gen-1?

Silné nástroje pro tvorbu a úpravu obrázků jsou odemčené pomocí textového průvodce generativní difúzní modely. Zatímco tyto byly aplikovány na tvorbu videí, současné způsoby úpravy obsahu již existujícího materiálu při zachování jeho struktury vyžadují nákladné přeškolování pro každý vstup nebo závisí na riskantním šíření obrazových změn mezi snímky.

Vývojáři popisují model pro strukturou a obsahem řízenou videodifuzi, která mění filmy na základě písemného nebo vizuálního popisu požadovaného výsledku. V důsledku nedostatečného oddělení vznikají konflikty mezi úpravami obsahu poskytovanými uživatelem a reprezentacemi struktury. Ukazují, že integritu struktury a obsahu lze řídit školením na monokulárních odhadech hloubky s různými úrovněmi detailů.

Syntetizujte nová videa realistickým a konzistentním způsobem použitím kompozice a stylu obrázku nebo textové výzvy na strukturu zdrojového videa. Je to jako natáčet něco nového, aniž byste vlastně něco natočili.

Syntetizace nového videa pomocí této metody umožňuje filmařům rychle produkovat obsah nákladově efektivním způsobem
Syntetizace nového videa pomocí této metody umožňuje filmařům rychle produkovat obsah nákladově efektivním způsobem

Přenesení stylu obrázku nebo výzvy do každého snímku videa může být skvělý způsob, jak sjednotit váš projekt, dát mu zastřešující vizuální téma a vytvořit konzistenci.

Pomocí softwaru a kreativního designu lze makety přeměnit na esteticky příjemné a interaktivní rendery, které oživí vize uživatele.

Makety umožňují návrhářům vizualizovat jejich nápady a vytvářet hmatatelné výsledky, které lze předložit ke kontrole
Makety umožňují návrhářům vizualizovat jejich nápady a vytvářet hmatatelné výsledky, které lze předložit ke kontrole

Díky funkcím pro úpravu videa je snadné izolovat části videa a vylepšit je textovými výzvami.

Použití vstupního obrázku popř prompt netexturované rendery mohou výrazně zlepšit jejich realismus a oživit 3D modely.

Runway Research se věnuje budování multimodálních systémů umělé inteligence, které umožňují nové formy kreativity. Gen-1 představuje další z našich klíčových kroků vpřed v této misi. Pokud jste kreativec a chcete experimentovat s budoucností vyprávění příběhů, požádejte o přístup níže.

Gen-1 lze také použít k vytvoření zcela nových videí od začátku. Může být použit pro řadu účelů, včetně vytváření nových verzí stávajících filmů nebo vytváření nových filmů úplně. Tato novinka jistě nadchne filmaře a další kreativce, kteří stále hledají nové způsoby, jak posouvat hranice svého umění. S Gen-1 mají nyní k dispozici nový mocný nástroj.

Schopnost vytvářet nová videa ze stávajících má řadu potenciálních aplikací. Například by mohl být použit k vytváření nových verzí stávajícího video obsahu, takže by mohl být použit pro vytváření alternativních verzí scén nebo záběrů, které mohou být příliš drahé nebo logisticky náročné na natáčení.

Můžete požádat o používání modelu, když je v beta testování zde.

Přečtěte si více o AI:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Hot Stories
Připojte se k našemu zpravodaji.
Novinky

The DOGE Frenzy: Analýza nedávného nárůstu hodnoty dogecoinu (DOGE).

Odvětví kryptoměn se rychle rozrůstá a meme coiny se připravují na výrazný vzestup. Dogecoin (DOGE),...

Vědět více

Vývoj obsahu generovaného umělou inteligencí v Metaverse

Vznik generativního obsahu umělé inteligence je jedním z nejvíce fascinujících pokroků ve virtuálním prostředí...

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Nejlepší nabídky tohoto týdne, velké investice do AI, IT, Web3a kryptoměny (22-26.04)
Strávit Business Trhy Technika
Nejlepší nabídky tohoto týdne, velké investice do AI, IT, Web3a kryptoměny (22-26.04)
26. dubna 2024
Vitalik Buterin komentuje centralizaci PoW a poznamenává, že to byla dočasná fáze do PoS
Novinky Technika
Vitalik Buterin komentuje centralizaci PoW a poznamenává, že to byla dočasná fáze do PoS
26. dubna 2024
Offchain Labs odhaluje objev dvou kritických zranitelností v důkazech o podvodech OP Stack společnosti Optimism
Novinky Vývoj Technika
Offchain Labs odhaluje objev dvou kritických zranitelností v důkazech o podvodech OP Stack společnosti Optimism
26. dubna 2024
Otevřený trh společnosti Dymension pro překlenutí likvidity z RollApps eIBC se spouští v síti Mainnet
Novinky Technika
Otevřený trh společnosti Dymension pro překlenutí likvidity z RollApps eIBC se spouští v síti Mainnet 
26. dubna 2024
CRYPTOMERIA LABS PTE. LTD.