Tudósítást Technológia
Március 22, 2023

Szöveg-videó A Gen-2 modell rövid videókat tud generálni szöveges promptok használatával

Röviden

A RunWayML új Gen-2 Text2Video modellje nem csak a meglévőket tudja szerkeszteni videók hanem újakat is generálhat a semmiből, csak szöveges prompt használatával.

Ez a funkció várhatóan javítani fogja azt a módot, ahogyan az emberek tartalmat hoznak létre és osztanak meg a közösségi média platformokon, lehetővé téve a felhasználók számára az átalakulást statikus képeket dinamikussá és lebilincselő videoklipek a videoszerkesztés előzetes ismerete nélkül.

A Runway új szöveg-videó modellje, a Gen-2 nem csak a meglévő videókat szerkesztheti, hanem a semmiből újakat is generálhat, csupán szöveges prompt használatával. Ez jelentős előrelépés a Gen előző verziójához képest, amely csak a meglévő videókat tudta szerkeszteni. A Gen-2 szöveg-videó modell a Runway legmodernebb mesterséges intelligencia technológiáját használja, hogy olyan videókat hozzon létre, amelyek megkülönböztethetetlenek az emberek által készített videóktól. Ezzel az új funkcióval a felhasználók időt és erőfeszítést takaríthatnak meg azáltal, hogy automatikusan generálnak videókat anélkül, hogy széleskörű videószerkesztési ismeretekre lenne szükségük.

Szöveg-videó A Gen-2 modell rövid videókat tud generálni szöveges promptok használatával

Az új Gen-2 modell egy feltöltött képet is képes a rövid videót csipesz. Ez egy szöveges utalással történik, amely leírja, hogy a felhasználó milyennek szeretné látni a videót. A videók időtartama egyelőre nem haladja meg a pár másodpercet, de a minőség már jóval magasabb a versenytársakénál (főleg, hogy a versenytársak neurális hálózatok nyilvánosan nem elérhetők). Ez a funkció várhatóan javítani fogja azt, ahogyan az emberek tartalmat hoznak létre és osztanak meg a közösségi média platformokon. A Gen-2 modellel a felhasználók egyszerűen átalakíthatják statikus képeiket dinamikus videoklippekké. Jó eséllyel a Facebook vagy a Tiktok használja ezt a technológiát arra, hogy kibővítse a tartalomkészítők számára elérhető AI-eszközök körét.

az AI videóverseny vad. Alig egy hét telt el a Gen-1 indulása óta, és a Gen-2 már megjelent. A technológiai vállalatok közötti verseny a legfejlettebb mesterséges intelligencia-videó technológia kifejlesztéséért rohamosan növekszik, és mindegyik vállalat arra törekszik, hogy felülmúlja a másikat.

A Gen új verziójának kipróbálásához regisztrálnia kell a sorba a következő oldalon Runway honlapja.

  • Runway, egy mesterséges intelligencia startup, bejelentette a Gen-1, egy neurális hálózat, amely üzenetek és képek kombinálásával a régi videókat újakká varázsolhatja. A Gen-1 lehetővé teszi a filmkészítők számára, hogy gyorsan, költséghatékony módon állítsanak elő tartalmat egy film kompozíciójának és stílusának alkalmazásával. kép vagy szöveges prompt a forrásvideó szerkezetéhez. A Runway Research a kreativitás új formáit lehetővé tevő multimodális mesterséges intelligencia-rendszerek kiépítésének elkötelezettje, a Gen-1 pedig felhasználható a történetmesélés jövőjével kapcsolatos kísérletezésre.
  • A múlt hónapban Sam Altman, a társaság társalapítója és vezérigazgatója OpenAI, nemrég beszélt a TechCrunch-nak, és azt mondta OpenAI fejleszt egy AI modell videókhoz és a GPT-4, amely azután lesz elérhető a nyilvánosság számára, hogy a vállalat megerősíti megbízhatóságát és biztonságát.
  • Októberben a Google kifejlesztette az Imagen Video-t, egy módszert a szöveges feltételes videók készítésére egy videósorozat alapján diffúziós modellek. A rendszer elfogadja a szöveges leírást, és 16 képkockás filmet generál három képkocka/másodperc sebességgel, 24 x 48 pixeles felbontással. A rendszer méretezi és „megjósolja” a plusz képkockákat, így 128 képkockás, 24 képkocka/másodperc sebességgel és 720p felbontású (1280×768) videót készít. Hatvanmillió kép-szöveg párt és 14 millió videó-szöveg párt használtak fel az Imagen Video betanítására.

Olvasson további kapcsolódó cikkeket:

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

További cikkek
Damir Jalalov
Damir Jalalov

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

Hot Stories
Csatlakozzon hírlevelünkhöz.
Legfrissebb hírek

A Ripple-től a The Big Green DAO-ig: Hogyan járulnak hozzá a kriptovaluta projektek a jótékonysághoz

Fedezze fel a digitális valutákban rejlő lehetőségeket jótékony célokra hasznosító kezdeményezéseket.

Tudjon meg többet

AlphaFold 3, Med-Gemini és mások: The Way AI Transforms Healthcare 2024

A mesterséges intelligencia különféle módokon nyilvánul meg az egészségügyben, az új genetikai összefüggések feltárásától a robotsebészeti rendszerek felhatalmazásáig...

Tudjon meg többet
Csatlakozzon innovatív technológiai közösségünkhöz
KATT ide
Tovább
A 10 legjobb ingyenes AI-eszköz tartalomkészítéshez, videószerkesztéshez és sok máshoz
AI Wiki megemészteni Oktatás Életmód szoftver Technológia
A 10 legjobb ingyenes AI-eszköz tartalomkészítéshez, videószerkesztéshez és sok máshoz
May 14, 2024
A Hongkongi Értékpapír Bizottság a kriptográfiai ágazatot célzó mélyhamis csalásokra figyelmeztet: következményei a befektetők biztonságára
Életmód Biztonság Wiki szoftver Történetek és vélemények Technológia
A Hongkongi Értékpapír Bizottság a kriptográfiai ágazatot célzó mélyhamis csalásokra figyelmeztet: következményei a befektetők biztonságára
May 14, 2024
A Ripple és az Evmos együttműködik az XRP Ledger EVM oldallánc fejlesztésén az EvmOS technológiával
üzleti Tudósítást Technológia
A Ripple és az Evmos együttműködik az XRP Ledger EVM oldallánc fejlesztésén az EvmOS technológiával
May 14, 2024
Az 5ireChain ösztönzött „Testnet Thunder: GA” programot kezdeményez a hálózati stresszteszthez, és felkéri a felhasználókat, hogy vegyenek részt Airdrop Jutalmak
Tudósítást Technológia
Az 5ireChain ösztönzött „Testnet Thunder: GA” programot kezdeményez a hálózati stresszteszthez, és felkéri a felhasználókat, hogy vegyenek részt Airdrop Jutalmak
May 14, 2024
CRYPTOMERIA LABS PTE. KFT.