Nyheds rapport
Oktober 06, 2022

Google overvinder Meta ved at lancere en ny tekst-til-video AI Generator, Imagen Video 

Kort sagt

Googles Imagen Video forsøger at hjælpe video-generator med at blive til dræbende apps

Det tog ikke lang tid, før Google svarede på Make-a-Video fra Meta. Ved at bruge en tekstprompt, Billedvideo kan producere en fantastisk video. Resultaterne er et enormt fremskridt i forhold til den kendte teknik på trods af en række ulemper.

I sammenligning med Facebooks tekst-til-video AI-generator Lav en video, er resultaterne mærkbart bedre. Denne strategi krævede dog også mere overblik. I modsætning til Imagen Video, hvor mikroarbejderne arbejdede hårdt med at kommentere film med skriftlige beskrivelser, brugte Make-a-Scene umærkede videoer til træning.

At gå ind i detaljerne i arkitekturen er meningsløst; du bør læse om det i artiklen link.. Vi kan kun bekræfte, at 16 billeder først genereres fra tekstindlejringen af ​​T5-koderen med en opløsning på 48×24 med 3 billeder i sekundet, og at dette derefter opskaleres af en række diffusionsmodeller til den endelige film på 128 billeder ved 1280×768 og 24 billeder i sekundet.

Hvad er Imagen Video?

Imagen Video er en metode til at skabe tekst-betingede videoer baseret på en række videodiffusionsmodeller. Imagen Video producerer film af høj kvalitet fra tekstbeskeder ved at kombinere en basisvideoproduktionsmodel med en række sammenflettede rumlige og tidsmæssige videomodeller med superopløsning. Gennemgå designvalgteamet, mens du skalerer systemet op som en høj-definition tekst-til-video-model, herunder beslutningen om at v-parameterisere diffusionsmodeller og udvælgelse af fuldt konvolutionelle tidsmæssige og rumlige superopløsningsmodeller ved specifikke opløsninger. Derudover validerer og anvender den resultater fra tidligere arbejde med diffusionsbaseret billedproduktion til konteksten af videogenerering. Videomodeller udsættes derefter for progressiv destillation med klassificeringsfri vejledning for hurtig prøvetagning af høj kvalitet.

Googles forskningsteam hævder, at systemet accepterer en tekstbeskrivelse og genererer en film på 16 billeder med tre billeder i sekundet med en opløsning på 24 gange 48 pixels. Systemet skalerer og "forudsiger" de ekstra billeder og skaber en endelig video med 128 billeder ved 24 billeder i sekundet og 720p opløsning (1280×768). Der er 60 millioner billed-tekst-par, og 14 millioner video-tekst-par blev brugt til at træne Imagen Video.

Billedvideoeksempler

Selvom det kun er fordi at bruge AI til at lave video er hurtigere og billigere, vil sådanne teknologier uden tvivl blive brugt overalt.

Interesseret i at læse mere? Her er nogle yderligere emner at tjekke ud:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Hot Stories
Tilmeld dig vores nyhedsbrev.
Seneste Nyheder

DOGE Frenzy: Analyser Dogecoins (DOGE) seneste stigning i værdi

Kryptovalutaindustrien ekspanderer hurtigt, og meme-mønter forbereder sig på et markant opsving. Dogecoin (DOGE), ...

Vide mere

Udviklingen af ​​AI-genereret indhold i metaverset

Fremkomsten af ​​generativt AI-indhold er en af ​​de mest fascinerende udviklinger i det virtuelle miljø ...

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
Tiger-mæglere lancerer handel med nulkommission for Bosera HashKey, China Asset Management og Harvest Spot Crypto ETF'er
Forretning Markeder Nyheds rapport
Tiger-mæglere lancerer handel med nulkommission for Bosera HashKey, China Asset Management og Harvest Spot Crypto ETF'er
April 29, 2024
Scroll fuldfører Bernoulli Mainnet-opgradering, forventer 10x fald i transaktionsomkostninger
Nyheds rapport Teknologier
Scroll fuldfører Bernoulli Mainnet-opgradering, forventer 10x fald i transaktionsomkostninger
April 29, 2024
OKX Jumpstart viser Runecoin, gør det muligt for BTC-indsats at tjene RUNE-poletter
Markeder Nyheds rapport Teknologier
OKX Jumpstart viser Runecoin, gør det muligt for BTC-indsats at tjene RUNE-poletter
April 29, 2024
Ugens bedste tilbud, store investeringer i AI, IT, Web3, og Crypto (22-26.04)
Fordøje Forretning Markeder Teknologier
Ugens bedste tilbud, store investeringer i AI, IT, Web3, og Crypto (22-26.04)
April 26, 2024