Teksto į vaizdo įrašą modelis Gen-2 gali generuoti trumpus vaizdo įrašus naudojant tekstinius raginimus
Trumpai
Naujasis Text2Video modelis Gen-2 iš RunWayML gali ne tik redaguoti esamą filmai bet ir kurti naujus nuo nulio, naudodami tik teksto raginimą.
Tikimasi, kad ši funkcija pagerins žmonių turinio kūrimą ir bendrinimą socialinės žiniasklaidos platformose, leisdama vartotojams transformuotis statinius vaizdus į dinamiškus ir patrauklūs vaizdo klipai be jokių išankstinių žinių apie vaizdo redagavimą.
Naujasis „Runway“ teksto į vaizdo įrašą modelis Gen-2 gali ne tik redaguoti esamus vaizdo įrašus, bet ir kurti naujus nuo nulio, naudodamas tik teksto raginimą. Tai reikšmingas patobulinimas, palyginti su ankstesne „Gen“ versija, kuria buvo galima redaguoti tik esamus vaizdo įrašus. Teksto į vaizdo įrašą modelis Gen-2 naudoja pažangiausią Runway AI technologiją, kad sukurtų vaizdo įrašus, kurie nesiskiria nuo žmonių sukurtų vaizdo įrašų. Naudodami šią naują funkciją, vartotojai gali sutaupyti laiko ir pastangų automatiškai generuodami vaizdo įrašus, nereikalaujant didelių vaizdo įrašų redagavimo įgūdžių.
Naujasis Gen-2 modelis taip pat gali paversti įkeltą vaizdą į a trumpas vaizdo įrašas klipas. Tai atliekama pateikiant teksto užuominą, apibūdinančią, koks vartotojas nori vaizdo įrašo. Kol kas vaizdo įrašų trukmė neviršija kelių sekundžių, tačiau kokybė jau gerokai aukštesnė nei konkurentų (juolab kad konkurentų neuroniniai tinklai nėra viešai prieinami). Tikimasi, kad ši funkcija pagerins žmonių kūrimą ir bendrinimą socialinės žiniasklaidos platformose. Naudodami Gen-2 modelį vartotojai gali lengvai paversti savo statinius vaizdus į dinamiškus vaizdo įrašus. Yra didelė tikimybė, kad „Facebook“ ar „Tiktok“ naudos šią technologiją norėdami išplėsti turinio kūrėjams prieinamų AI įrankių rinkinį.
AI vaizdo lenktynės yra laukinės. Nuo Gen-1 paleidimo praėjo vos savaitė, o Gen-2 jau išleistas. Technologijų kompanijų konkurencija kuriant pažangiausią AI vaizdo technologiją sparčiai auga, kiekviena įmonė stengiasi pranokti kitą.
Norėdami išbandyti naują Gen versiją, turėsite užsiregistruoti eilėje Runway svetainė.
- Runway, dirbtinio intelekto startuolis, paskelbė Gen-1, neuroninis tinklas, galintis senus vaizdo įrašus paversti naujais, derindamas raginimus ir vaizdus. „Gen-1“ leidžia filmų kūrėjams greitai sukurti turinį ekonomiškai efektyviu būdu, taikant filmo kompoziciją ir stilių. vaizdo ar teksto raginimas į šaltinio vaizdo įrašo struktūrą. „Runway Research“ skirta kurti daugiarūšes AI sistemas, kurios įgalina naujas kūrybiškumo formas, o „Gen-1“ galima naudoti eksperimentuojant su pasakojimo ateitimi.
- Praėjusį mėnesį Samas Altmanas, vienas iš įkūrėjų ir generalinis direktorius OpenAI, neseniai kalbėjosi su „TechCrunch“ ir pasakė, kad OpenAI kuria an AI modelis vaizdo įrašams ir GPT-4, kuris bus prieinamas visuomenei po to, kai įmonė patvirtins savo patikimumą ir saugumą.
- Spalio mėn. „Google“ sukūrė „Imagen Video“ – metodą, leidžiantį sukurti tekstinius vaizdo įrašus pagal vaizdo įrašų seriją difuzijos modeliai. Sistema priima tekstinį aprašymą ir sukuria 16 kadrų filmą trijų kadrų per sekundę greičiu, kurio skiriamoji geba yra 24 x 48 pikseliai. Sistema keičia ir „numato“ papildomus kadrus, sukurdama galutinį vaizdo įrašą su 128 kadrais 24 kadrų per sekundę greičiu ir 720p raiška (1280 × 768). „Imagen Video“ mokymui buvo panaudota šešiasdešimt milijonų vaizdo ir teksto porų ir 14 milijonų vaizdo ir teksto porų.
Skaitykite daugiau susijusių straipsnių:
Atsakomybės neigimas
Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.
Apie autorių
Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže.
Daugiau straipsniųDamiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže.