Uudiste reportaaž
Oktoober 06, 2022

Google ületab meta, käivitades uue teksti-videoks tehisintellekti generaatori, Imagen Video 

Põgusalt

Google'i Imagen Video püüab aidata videogeneraatoril muutuda tapjarakendusteks

Ei läinud kaua, kui Google vastas Meta saatele Make-a-Video. Tekstiviipa kasutades Pildivideo võib luua fantastilise video. Vaatamata mitmetele puudustele on tulemused tohutult kõrgemad kui tehnika tase.

Võrreldes Facebooki tekstist videoks tehisintellekti generaatoriga Tee video, on tulemused märgatavalt paremad. See strateegia nõudis aga ka suuremat järelevalvet. Erinevalt Imagen Videost, kus mikrotöötajad nägid palju vaeva, et lisada filmidele kirjalike kirjeldustega märkusi, kasutas Make-a-Scene koolituseks märgistamata videoid.

Arhitektuuri spetsiifikasse laskumine on mõttetu; peaksite selle kohta artiklist lugema siin. Võime vaid kinnitada, et T16 kodeerija teksti manustamisel genereeritakse esmalt 5 kaadrit eraldusvõimega 48 × 24 ja 3 kaadrit sekundis ning seejärel suurendatakse seda mitme difusioonimudeli abil lõplikuks 128 kaadriliseks filmiks. 1280×768 ja 24 kaadrit sekundis.

Mis on Imagen Video?

Imagen Video on meetod tekstitingimustega videote loomiseks, mis põhinevad video hajutamismudelitel. Imagen Video toodab kvaliteetseid filme tekstiviipasid kombineerides videotootmise baasmudeli rea ülerealaotusega ruumilise ja ajalise video ülieraldusvõimega mudelitega. Tutvuge disainivalikute meeskonnaga, mille tegi süsteemi laiendamisel kõrgetasemelisenadefitekstist videoks muutev mudel, sealhulgas otsus difusioonimudelite v-parameetrite kohta ja täielikult konvolutsiooniliste ajalise ja ruumilise ülieraldusvõime mudelite valik teatud eraldusvõimega. Lisaks kinnitab ja rakendab see varasemate difusioonipõhise kujutise tootmisega seotud töö tulemusi kontekstis video genereerimine. Seejärel destilleeritakse videomudelid järk-järgult klassifikaatorivaba juhistega kiireks ja kvaliteetseks proovivõtuks.

Google'i uurimisrühm väidab, et süsteem aktsepteerib tekstilist kirjeldust ja genereerib 16-kaadrilise filmi kolm kaadrit sekundis eraldusvõimega 24 x 48 pikslit. Süsteem skaleerib ja "ennustab" lisakaadreid, luues lõpliku video 128 kaadriga 24 kaadrit sekundis ja 720p eraldusvõimega (1280 × 768). Pilt-teksti paari on 60 miljonit ja Imagen Video treenimiseks kasutati 14 miljonit video-teksti paari.

Pildivideo näidised

Isegi kui lihtsalt sellepärast, et AI kasutamine video tegemiseks on kiirem ja odavam, kasutatakse selliseid tehnoloogiaid kahtlemata kõikjal.

Kas olete huvitatud rohkem lugemisest? Siin on mõned täiendavad teemad, mida kontrollida:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Veel artikleid
Damir Jalalov
Damir Jalalov

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Hot Stories
Liituge meie uudiskirjaga.
Uudised

DOGE Frenzy: Dogecoini (DOGE) hiljutise väärtuse tõusu analüüsimine

Krüptorahatööstus laieneb kiiresti ja meemmündid valmistuvad oluliseks tõusuks. Dogecoin (DOGE), ...

Rohkem teada

AI-ga loodud sisu areng metaversumis

Generatiivse AI-sisu tekkimine on üks põnevamaid arenguid virtuaalkeskkonnas ...

Rohkem teada
Liituge meie uuendusliku tehnikakogukonnaga
Loe rohkem
Loe edasi
Selle nädala parimad pakkumised, suured investeeringud tehisintellekti, IT-sse, Web3ja krüpto (22-26.04)
Digest Äri turud Tehnoloogia
Selle nädala parimad pakkumised, suured investeeringud tehisintellekti, IT-sse, Web3ja krüpto (22-26.04)
Aprill 26, 2024
Vitalik Buterin kommenteerib PoW tsentraliseerimist, märgib, et see oli ajutine etapp kuni PoS-i
Uudiste reportaaž Tehnoloogia
Vitalik Buterin kommenteerib PoW tsentraliseerimist, märgib, et see oli ajutine etapp kuni PoS-i
Aprill 26, 2024
Offchain Labs paljastab kaks kriitilist haavatavust Optimismi OP Stacki pettuste tõendites
Uudiste reportaaž tarkvara Tehnoloogia
Offchain Labs paljastab kaks kriitilist haavatavust Optimismi OP Stacki pettuste tõendites
Aprill 26, 2024
Dymensioni avatud turg likviidsuse ületamiseks RollAppsist eIBC ilmub Mainnet'is
Uudiste reportaaž Tehnoloogia
Dymensioni avatud turg likviidsuse ületamiseks RollAppsist eIBC ilmub Mainnet'is 
Aprill 26, 2024
CRYPTOMERIA LABS PTE. LTD.