Vijesti Tehnologija
Ožujak 22, 2023

Tekst-u-video model Gen-2 može generirati kratke videozapise pomoću tekstualnih upita

Ukratko

Novi Text2Video model Gen-2 iz RunWayML-a ne može samo uređivati ​​postojeće videos ali i generirajte nove od nule, koristeći samo tekstualni upit.

Očekuje se da će ova značajka poboljšati način na koji ljudi stvaraju i dijele sadržaj na platformama društvenih medija, omogućujući korisnicima transformaciju statične slike u dinamičke i zanimljivi videoisječci bez ikakvog prethodnog znanja o uređivanju videa.

Novi model teksta u video Gen-2 tvrtke Runway ne samo da može uređivati ​​postojeće videozapise, već i generirati nove ispočetka, koristeći samo tekstualni upit. Ovo je značajno poboljšanje u odnosu na prethodnu verziju Gena, koja je mogla uređivati ​​samo postojeće videozapise. Model za pretvaranje teksta u video Gen-2 koristi Runwayovu vrhunsku AI tehnologiju za stvaranje videozapisa koji se ne mogu razlikovati od onih koje su napravili ljudi. S ovom novom značajkom korisnici mogu uštedjeti vrijeme i trud automatskim generiranjem videozapisa bez potrebe za opsežnim vještinama uređivanja videozapisa.

Tekst-u-video model Gen-2 može generirati kratke videozapise pomoću tekstualnih upita

Novi Gen-2 model također može pretvoriti učitanu sliku u kratki videozapis isječak. To se postiže pružanjem tekstualnog savjeta koji opisuje kakav korisnik želi da video bude. Za sada trajanje videa ne prelazi nekoliko sekundi, ali kvaliteta je već znatno viša od one kod konkurenata (posebice jer konkurenti neuronske mreže nisu javno dostupni). Očekuje se da će ova značajka poboljšati način na koji ljudi stvaraju i dijele sadržaj na platformama društvenih medija. S modelom Gen-2, korisnici mogu jednostavno transformirati svoje statične slike u dinamične videoisječke. Postoji velika vjerojatnost da će Facebook ili Tiktok koristiti ovu tehnologiju za proširenje skupa AI alata dostupnih kreatorima sadržaja.

AI video utrka je divlja. Prošlo je samo tjedan dana od lansiranja Gen-1, a Gen-2 je već izašao. Natjecanje među tehnološkim tvrtkama u razvoju najnaprednije AI video tehnologije brzo raste, a svaka tvrtka nastoji nadmašiti drugu.

Da biste isprobali novu verziju Gena, morat ćete se prijaviti u red čekanja na Web stranica piste.

  • Runway, startup za umjetnu inteligenciju, najavio je Gen-1, neuronska mreža koja može pretvoriti stare videozapise u nove kombiniranjem upita i slika. Gen-1 omogućuje filmašima brzu proizvodnju sadržaja na isplativ način primjenom kompozicije i stila slikovni ili tekstualni upit na strukturu izvornog videa. Runway Research posvećen je izgradnji multimodalnih AI sustava koji omogućuju nove oblike kreativnosti, a Gen-1 se može koristiti za eksperimentiranje s budućnošću pripovijedanja.
  • Prošli mjesec, Sam Altman, suosnivač i izvršni direktor tvrtke OpenAI, nedavno je razgovarao s TechCrunchom i rekao to OpenAI razvija se AI model za video i GPT-4, koji će biti dostupni javnosti nakon što tvrtka potvrdi svoju pouzdanost i sigurnost.
  • Google je u listopadu razvio Imagen Video, metodu za stvaranje tekstualno uvjetovanih videozapisa na temelju serije videozapisa difuzijski modeli. Sustav prihvaća tekstualni opis i generira film od 16 sličica pri tri slike u sekundi s rezolucijom od 24 x 48 piksela. Sustav skalira i "predviđa" dodatne okvire, stvarajući konačni video sa 128 okvira pri 24 okvira u sekundi i 720p rezoluciji (1280×768). Šezdeset milijuna parova slika-tekst i 14 milijuna parova video-tekst korišteno je za obuku Imagen Videoa.

Pročitajte više povezanih članaka:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Više članaka
Damir Yalalov
Damir Yalalov

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Od Ripplea do Big Green DAO-a: Kako projekti kriptovaluta pridonose dobrotvornim aktivnostima

Istražimo inicijative koje iskorištavaju potencijal digitalnih valuta u dobrotvorne svrhe.

Znati više

AlphaFold 3, Med-Gemini i drugi: način na koji umjetna inteligencija transformira zdravstvo 2024.

AI se manifestira na različite načine u zdravstvu, od otkrivanja novih genetskih korelacija do osnaživanja robotskih kirurških sustava...

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
Od Ripplea do Big Green DAO-a: Kako projekti kriptovaluta pridonose dobrotvornim aktivnostima
Analiza Kriptovalute Wiki posao Obrazovanje Lifestyle tržišta softver Tehnologija
Od Ripplea do Big Green DAO-a: Kako projekti kriptovaluta pridonose dobrotvornim aktivnostima
Neka 13, 2024
AlphaFold 3, Med-Gemini i drugi: način na koji umjetna inteligencija transformira zdravstvo 2024.
AI Wiki Analiza probaviti Mišljenje posao tržišta Vijesti softver Priče i recenzije Tehnologija
AlphaFold 3, Med-Gemini i drugi: način na koji umjetna inteligencija transformira zdravstvo 2024.
Neka 13, 2024
Mreža Nim za uvođenje okvira za tokenizaciju vlasništva AI i provođenje prodaje prinosa s datumom snimke zakazanim za svibanj
tržišta Vijesti Tehnologija
Mreža Nim za uvođenje okvira za tokenizaciju vlasništva AI i provođenje prodaje prinosa s datumom snimke zakazanim za svibanj
Neka 13, 2024
Binance je partner s Argentinom u borbi protiv kibernetičkog kriminala
Mišljenje posao tržišta Vijesti softver Tehnologija
Binance je partner s Argentinom u borbi protiv kibernetičkog kriminala
Neka 13, 2024
CRYPTOMERIA LABS PTE. LTD.