Naujienų ataskaita Technologija
Kovo 22, 2023

Teksto į vaizdo įrašą modelis Gen-2 gali generuoti trumpus vaizdo įrašus naudojant tekstinius raginimus

Trumpai

Naujasis Text2Video modelis Gen-2 iš RunWayML gali ne tik redaguoti esamą filmai bet ir kurti naujus nuo nulio, naudodami tik teksto raginimą.

Tikimasi, kad ši funkcija pagerins žmonių turinio kūrimą ir bendrinimą socialinės žiniasklaidos platformose, leisdama vartotojams transformuotis statinius vaizdus į dinamiškus ir patrauklūs vaizdo klipai be jokių išankstinių žinių apie vaizdo redagavimą.

Naujasis „Runway“ teksto į vaizdo įrašą modelis Gen-2 gali ne tik redaguoti esamus vaizdo įrašus, bet ir kurti naujus nuo nulio, naudodamas tik teksto raginimą. Tai reikšmingas patobulinimas, palyginti su ankstesne „Gen“ versija, kuria buvo galima redaguoti tik esamus vaizdo įrašus. Teksto į vaizdo įrašą modelis Gen-2 naudoja pažangiausią Runway AI technologiją, kad sukurtų vaizdo įrašus, kurie nesiskiria nuo žmonių sukurtų vaizdo įrašų. Naudodami šią naują funkciją, vartotojai gali sutaupyti laiko ir pastangų automatiškai generuodami vaizdo įrašus, nereikalaujant didelių vaizdo įrašų redagavimo įgūdžių.

Teksto į vaizdo įrašą modelis Gen-2 gali generuoti trumpus vaizdo įrašus naudojant tekstinius raginimus

Naujasis Gen-2 modelis taip pat gali paversti įkeltą vaizdą į a trumpas vaizdo įrašas klipas. Tai atliekama pateikiant teksto užuominą, apibūdinančią, koks vartotojas nori vaizdo įrašo. Kol kas vaizdo įrašų trukmė neviršija kelių sekundžių, tačiau kokybė jau gerokai aukštesnė nei konkurentų (juolab kad konkurentų neuroniniai tinklai nėra viešai prieinami). Tikimasi, kad ši funkcija pagerins žmonių kūrimą ir bendrinimą socialinės žiniasklaidos platformose. Naudodami Gen-2 modelį vartotojai gali lengvai paversti savo statinius vaizdus į dinamiškus vaizdo įrašus. Yra didelė tikimybė, kad „Facebook“ ar „Tiktok“ naudos šią technologiją norėdami išplėsti turinio kūrėjams prieinamų AI įrankių rinkinį.

AI vaizdo lenktynės yra laukinės. Nuo Gen-1 paleidimo praėjo vos savaitė, o Gen-2 jau išleistas. Technologijų kompanijų konkurencija kuriant pažangiausią AI vaizdo technologiją sparčiai auga, kiekviena įmonė stengiasi pranokti kitą.

Norėdami išbandyti naują Gen versiją, turėsite užsiregistruoti eilėje Runway svetainė.

  • Runway, dirbtinio intelekto startuolis, paskelbė Gen-1, neuroninis tinklas, galintis senus vaizdo įrašus paversti naujais, derindamas raginimus ir vaizdus. „Gen-1“ leidžia filmų kūrėjams greitai sukurti turinį ekonomiškai efektyviu būdu, taikant filmo kompoziciją ir stilių. vaizdo ar teksto raginimas į šaltinio vaizdo įrašo struktūrą. „Runway Research“ skirta kurti daugiarūšes AI sistemas, kurios įgalina naujas kūrybiškumo formas, o „Gen-1“ galima naudoti eksperimentuojant su pasakojimo ateitimi.
  • Praėjusį mėnesį Samas Altmanas, vienas iš įkūrėjų ir generalinis direktorius OpenAI, neseniai kalbėjosi su „TechCrunch“ ir pasakė, kad OpenAI kuria an AI modelis vaizdo įrašams ir GPT-4, kuris bus prieinamas visuomenei po to, kai įmonė patvirtins savo patikimumą ir saugumą.
  • Spalio mėn. „Google“ sukūrė „Imagen Video“ – metodą, leidžiantį sukurti tekstinius vaizdo įrašus pagal vaizdo įrašų seriją difuzijos modeliai. Sistema priima tekstinį aprašymą ir sukuria 16 kadrų filmą trijų kadrų per sekundę greičiu, kurio skiriamoji geba yra 24 x 48 pikseliai. Sistema keičia ir „numato“ papildomus kadrus, sukurdama galutinį vaizdo įrašą su 128 kadrais 24 kadrų per sekundę greičiu ir 720p raiška (1280 × 768). „Imagen Video“ mokymui buvo panaudota šešiasdešimt milijonų vaizdo ir teksto porų ir 14 milijonų vaizdo ir teksto porų.

Skaitykite daugiau susijusių straipsnių:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Daugiau straipsnių
Damiras Jalalovas
Damiras Jalalovas

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Hot Stories
Prisijunkite prie mūsų naujienlaiškio.
Paskutinės naujienos

Nuo Ripple iki Big Green DAO: kaip kriptovaliutų projektai prisideda prie labdaros

Išnagrinėkime iniciatyvas, kurios panaudoja skaitmeninių valiutų potencialą labdaros tikslais.

Žinoti daugiau

„AlphaFold 3“, „Med-Gemini“ ir kiti: „The Way AI Transforms Healthcare 2024“

DI pasireiškia įvairiais būdais sveikatos priežiūros srityje: nuo naujų genetinių koreliacijų atskleidimo iki robotų chirurginių sistemų įgalinimo...

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
Nuo Ripple iki Big Green DAO: kaip kriptovaliutų projektai prisideda prie labdaros
Analizė Kripto Wiki Atsakingas verslas Išsilavinimas Gyvenimo būdas rinkos programinė įranga Technologija
Nuo Ripple iki Big Green DAO: kaip kriptovaliutų projektai prisideda prie labdaros
Gali 13, 2024
„AlphaFold 3“, „Med-Gemini“ ir kiti: „The Way AI Transforms Healthcare 2024“
AI Wiki Analizė Virškinimas Nuomonė Atsakingas verslas rinkos Naujienų ataskaita programinė įranga Istorijos ir apžvalgos Technologija
„AlphaFold 3“, „Med-Gemini“ ir kiti: „The Way AI Transforms Healthcare 2024“
Gali 13, 2024
„Nim“ tinklas įdiegs dirbtinio intelekto nuosavybės teisių ženklinimo sistemą ir vykdys pajamingumo pardavimą su momentine data, numatyta gegužės mėn.
rinkos Naujienų ataskaita Technologija
„Nim“ tinklas įdiegs dirbtinio intelekto nuosavybės teisių ženklinimo sistemą ir vykdys pajamingumo pardavimą su momentine data, numatyta gegužės mėn.
Gali 13, 2024
„Binance“ bendradarbiauja su Argentina kovojant su elektroniniais nusikaltimais
Nuomonė Atsakingas verslas rinkos Naujienų ataskaita programinė įranga Technologija
„Binance“ bendradarbiauja su Argentina kovojant su elektroniniais nusikaltimais
Gali 13, 2024
CRYPTOMERIA LABS PTE. LTD.