Google predstavlja inovativno generativno slikovno dinamiko, ki simulira dinamične prizore v statičnih slikah
Google je predstavil a Generativna dinamika slike, nov pristop omogoča transformacijo a eno samo statično sliko v brezhibni zankasti video ali interaktivni dinamični prizor, ki ponuja široko paleto praktičnih aplikacij.
Jedro te pionirske tehnologije je modeliranje slikovnega prostora pred dinamiko scene. Cilj je ustvariti celovito razumevanje tega, kako se lahko predmeti in elementi v sliki obnašajo, ko so izpostavljeni različnim dinamičnim interakcijam. To razumevanje je nato mogoče uporabiti za učinkovito simulacijo odziva dinamike objekta na uporabniške interakcije.
Ključna značilnost te tehnologije je zmožnost ustvarjanja neprekinjenih videoposnetkov v zanki. Z izkoriščanjem slikovnega prostora pred dinamiko prizora lahko Googlov sistem ekstrapolira in razširi gibanje elementov v sliki ter jo spremeni v očarljivo in neprekinjeno video zanko. Ta funkcionalnost odpira ustvarjalcem in oblikovalcem vsebin številne ustvarjalne možnosti.
Tehnologija uporabnikom omogoča realistično interakcijo s predmeti v statičnih slikah. Googlov sistem omogoča simulacijo odziva dinamike objekta na vznemirjenje uporabnika poglobljene in interaktivne izkušnje znotraj slik. To ima potencial za revolucijo prostori metaverzuma in kako se uporabniki ukvarjajo z vizualno vsebino.
Osnova te inovacije je natančno izurjen model. Googlov model se uči iz obsežnega nabora podatkov o trajektorijah gibanja, pridobljenih iz resničnih video sekvenc, ki prikazujejo naravno, nihajoče gibanje. Te sekvence vključujejo prizore z elementi, kot so majanje dreves, premikanje rož, utripanje sveč in oblačila, ki se valovijo v vetru. Ta raznolik nabor podatkov omogoča modelu razumevanje širokega nabora dinamičnih vedenj.
Ko je predstavljen z a ena sama slika, usposobljeni model uporablja frekvenčno usklajen postopek vzorčenja difuzije. Ta postopek napove dolgoročno predstavitev gibanja na slikovno piko v Fourierjevi domeni, imenovano nevronska stohastična tekstura gibanja. Ta predstavitev se nato pretvori v zgoščene trajektorije gibanja, ki zajemajo celoten video. Skupaj z modulom za upodabljanje, ki temelji na slikah, je mogoče te trajektorije izkoristiti za različne praktične aplikacije.
V primerjavi s prednostmi pred neobdelanimi slikovnimi pikami RGB prednosti pred zajemanjem gibanja zajamejo bolj temeljno, nizkodimenzionalno poddimenzionalno strukturo, ki učinkovito pojasnjuje razlike v vrednostih slikovnih pik. To vodi do bolj skladnega dolgoročnega ustvarjanja in bolj natančnega nadzora nad animacijami v primerjavi s prejšnjimi metodami, ki izvajajo slikovna animacija prek neobdelane video sinteze.
Ustvarjena predstavitev gibanja je priročna za številne nadaljnje aplikacije, kot je ustvarjanje brezšivnih videoposnetkov v zanki, urejanje ustvarjenega gibanja in omogočanje interaktivnih dinamične slike, ki simulira odziv dinamike objekta na sile, ki jih izvaja uporabnik.
Preberite več povezanih tem:
Zavrnitev odgovornosti
V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.
O avtorju
Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta.
več člankovDamir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta.