Vijesti
Listopada 06, 2022

Google nadvladao Meta lansiranjem novog AI generatora teksta u video, Imagen Video 

Ukratko

Googleov Imagen Video pokušava pomoći da se videogenerator pretvori u ubojite aplikacije

Googleu nije dugo trebalo da odgovori na Make-a-Video od Mete. Korištenjem tekstualnog upita, Slika Video može proizvesti fantastičan video. Rezultati su golem napredak u odnosu na stanje tehnike unatoč nizu nedostataka.

U usporedbi s Facebookovim Text-to-Video AI generatorom Napravi video, rezultati su osjetno bolji. Međutim, ova strategija također je zahtijevala više nadzora. Za razliku od Imagen Videoa, gdje su mikroradnici naporno radili da bi dodali bilješke filmovima pisanim opisima, Make-a-Scene je koristio neoznačene videozapise za obuku.

Ulaziti u specifičnosti arhitekture je bespredmetno; trebali biste o tome pročitati u članku ovdje. Možemo samo potvrditi da se 16 okvira prvo generira iz teksta ugrađenog T5 kodera u rezoluciji od 48 × 24 s 3 okvira u sekundi, a da se to zatim povećava brojnim difuzijskim modelima u konačni film od 128 okvira. u 1280×768 i 24 sličice u sekundi.

Što je Imagen Video?

Imagen Video metoda je za stvaranje tekstualno uvjetovanih videozapisa na temelju niza modela videodifuzije. Imagen Video proizvodi visokokvalitetne filmove iz tekstualne upute kombiniranjem osnovnog modela videoprodukcije sa nizom isprepletenih prostornih i vremenskih video modela super rezolucije. Pregledajte izbore dizajna koje je tim napravio dok je povećavao sustav kao visokodefinicijski model teksta u video, uključujući odluku o v-parametrizaciji difuzijskih modela i odabir potpuno konvolucijskih vremenskih i prostornih modela super-rezolucije na određenim razlučivostima. Osim toga, potvrđuje i primjenjuje rezultate iz ranijeg rada na proizvodnji slike temeljene na difuziji u kontekstu video generiranje. Video modeli se zatim podvrgavaju progresivnoj destilaciji uz navođenje bez klasifikatora za brzo uzorkovanje visoke kvalitete.

Googleov istraživački tim tvrdi da sustav prihvaća tekstualni opis i generira film od 16 sličica pri tri sličice u sekundi s rezolucijom od 24 x 48 piksela. Sustav skalira i "predviđa" dodatne okvire, stvarajući konačni video sa 128 okvira pri 24 okvira u sekundi i 720p rezoluciji (1280×768). Postoji 60 milijuna parova slika-tekst i 14 milijuna parova video-tekst korišteno je za treniranje Imagen Video.

Imagen Video uzorci

Čak i ako samo zato što je korištenje umjetne inteligencije za izradu videa brže i jeftinije, takve će se tehnologije nedvojbeno koristiti posvuda.

Želite li čitati više? Evo nekoliko dodatnih tema koje možete provjeriti:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Više članaka
Damir Yalalov
Damir Yalalov

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Hot Stories
Pridružite se našem biltenu.
Najnovije vijesti

DOGE Frenzy: analiziranje nedavnog porasta vrijednosti Dogecoina (DOGE)

Industrija kriptovaluta brzo se širi, a meme kovanice se pripremaju za značajan uzlet. Dogecoin (DOGE), ...

Znati više

Evolucija sadržaja generiranog umjetnom inteligencijom u metaverzumu

Pojava generativnog AI sadržaja jedan je od najfascinantnijih razvoja unutar virtualnog okruženja...

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
Najbolje ponude ovog tjedna, velika ulaganja u AI, IT, Web3, i Crypto (22-26.04.)
probaviti posao tržišta Tehnologija
Najbolje ponude ovog tjedna, velika ulaganja u AI, IT, Web3, i Crypto (22-26.04.)
Travnja 26, 2024
Vitalik Buterin komentira centralizaciju PoW-a, napominje da je to bila privremena faza do PoS-a
Vijesti Tehnologija
Vitalik Buterin komentira centralizaciju PoW-a, napominje da je to bila privremena faza do PoS-a
Travnja 26, 2024
Offchain Labs otkriva otkriće dviju kritičnih ranjivosti u dokazima prijevare Optimismovog OP Stacka
Vijesti softver Tehnologija
Offchain Labs otkriva otkriće dviju kritičnih ranjivosti u dokazima prijevare Optimismovog OP Stacka
Travnja 26, 2024
Dymensionovo otvoreno tržište za premošćivanje likvidnosti iz RollApps eIBC pokreće na glavnoj mreži
Vijesti Tehnologija
Dymensionovo otvoreno tržište za premošćivanje likvidnosti iz RollApps eIBC pokreće na glavnoj mreži 
Travnja 26, 2024
CRYPTOMERIA LABS PTE. LTD.