Model převodu textu na video Gen-2 dokáže generovat krátká videa pomocí textových výzev
Stručně
Nový Text2Video model Gen-2 od RunWayML umí nejen upravovat stávající videa ale také generovat nové od začátku, pouze pomocí textové výzvy.
Očekává se, že tato funkce zlepší způsob, jakým lidé vytvářejí a sdílejí obsah na platformách sociálních médií, což uživatelům umožní transformaci statické obrázky na dynamické a poutavé videoklipy bez předchozí znalosti úpravy videa.
Nový model pro převod textu na video Gen-2 od Runway dokáže nejen upravovat stávající videa, ale také generovat nová od začátku, pouze pomocí textové výzvy. Jde o výrazné vylepšení oproti předchozí verzi Gen, která uměla upravovat pouze existující videa. Model Gen-2 pro převod textu na video využívá špičkovou technologii AI společnosti Runway k vytváření videí, která jsou k nerozeznání od videí vytvořených lidmi. S touto novou funkcí mohou uživatelé ušetřit čas a námahu automatickým generováním videí bez nutnosti rozsáhlých dovedností v oblasti úpravy videa.
Nový model Gen-2 je také schopen proměnit nahraný obrázek na soubor krátké video klip. To se provádí poskytnutím textové nápovědy popisující, jaké video chce uživatel mít. Zatím délka videí nepřesahuje několik sekund, ale kvalita je již mnohem vyšší než u konkurence (zejména proto, neuronové sítě nejsou veřejně dostupné). Očekává se, že tato funkce zlepší způsob, jakým lidé vytvářejí a sdílejí obsah na platformách sociálních médií. S modelem Gen-2 mohou uživatelé snadno transformovat své statické obrázky na dynamické videoklipy. Je velká šance, že Facebook nebo Tiktok tuto technologii využijí k rozšíření sady nástrojů umělé inteligence, které mají tvůrci obsahu k dispozici.
AI video závod je divoký. Od vypuštění Gen-1 uplynul pouhý týden a Gen-2 je již venku. Konkurence mezi technologickými společnostmi ve vývoji nejpokročilejší video technologie AI se rychle zvyšuje a každá společnost se snaží překonat tu druhou.
Chcete-li vyzkoušet novou verzi Gen, budete se muset zapsat do fronty na Webové stránky dráhy.
- Runway, startup s umělou inteligencí, oznámila Gen-1, neuronová síť, která dokáže přeměnit stará videa na nová tím, že kombinuje výzvy a obrázky. Gen-1 umožňuje filmařům rychle produkovat obsah nákladově efektivním způsobem použitím kompozice a stylu obrázkovou nebo textovou výzvu ke struktuře zdrojového videa. Runway Research se věnuje budování multimodálních systémů umělé inteligence, které umožňují nové formy kreativity, a Gen-1 lze použít k experimentování s budoucností vyprávění příběhů.
- Minulý měsíc Sam Altman, spoluzakladatel a generální ředitel společnosti OpenAI, nedávno mluvil s TechCrunch a řekl to OpenAI vyvíjí an AI model pro videa a GPT-4, který bude veřejnosti zpřístupněn poté, co společnost potvrdí jeho důvěryhodnost a bezpečnost.
- V říjnu Google vyvinul Imagen Video, metodu pro vytváření textově podmíněných videí na základě série videí difúzní modely. Systém přijímá textový popis a generuje 16snímkový film rychlostí 24 snímky za sekundu s rozlišením 48 x 128 pixelů. Systém škáluje a „předpovídá“ další snímky a vytváří konečné video se 24 snímky při 720 snímcích za sekundu a rozlišením 1280p (768×14). K trénování Imagen Video bylo použito XNUMX milionů párů obrázek-text a XNUMX milionů párů video-text.
Přečtěte si další související články:
Odmítnutí odpovědnosti
V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.
O autorovi
Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu.
Další článkyDamir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu.