Novice Tehnologija
September 19, 2023

Google predstavlja inovativno generativno slikovno dinamiko, ki simulira dinamične prizore v statičnih slikah

Google je predstavil a Generativna dinamika slike, nov pristop omogoča transformacijo a eno samo statično sliko v brezhibni zankasti video ali interaktivni dinamični prizor, ki ponuja široko paleto praktičnih aplikacij.

Google predstavlja inovativno generativno slikovno dinamiko, ki simulira dinamične prizore v statičnih slikah

Jedro te pionirske tehnologije je modeliranje slikovnega prostora pred dinamiko scene. Cilj je ustvariti celovito razumevanje tega, kako se lahko predmeti in elementi v sliki obnašajo, ko so izpostavljeni različnim dinamičnim interakcijam. To razumevanje je nato mogoče uporabiti za učinkovito simulacijo odziva dinamike objekta na uporabniške interakcije.

Ključna značilnost te tehnologije je zmožnost ustvarjanja neprekinjenih videoposnetkov v zanki. Z izkoriščanjem slikovnega prostora pred dinamiko prizora lahko Googlov sistem ekstrapolira in razširi gibanje elementov v sliki ter jo spremeni v očarljivo in neprekinjeno video zanko. Ta funkcionalnost odpira ustvarjalcem in oblikovalcem vsebin številne ustvarjalne možnosti.

Prispevek predstavlja pristop k modeliranju predhodnega slikovnega prostora, ki temelji na dinamiki scene, ki se je naučimo iz zbirke trajektorij gibanja, pridobljenih iz resničnih video sekvenc, ki vsebujejo naravno, nihajoče gibanje, kot so drevesa, rože, sveče in oblačila, ki pihajo v vetru. . Usposobljeni model uporablja frekvenčno koordiniran postopek vzorčenja difuzije za napovedovanje dolgoročne predstavitve gibanja na slikovno piko v Fourierjevi domeni, ki jo imenujejo živčna stohastična tekstura gibanja. To predstavitev je mogoče pretvoriti v zgoščene trajektorije gibanja, ki zajemajo celoten video.

Tehnologija uporabnikom omogoča realistično interakcijo s predmeti v statičnih slikah. Googlov sistem omogoča simulacijo odziva dinamike objekta na vznemirjenje uporabnika poglobljene in interaktivne izkušnje znotraj slik. To ima potencial za revolucijo prostori metaverzuma in kako se uporabniki ukvarjajo z vizualno vsebino.

Študija raziskuje modeliranje generativnega predhodnika za gibanje scene v slikovnem prostoru, tj. gibanje vseh slikovnih pik v eni sami sliki. Model se uri na samodejno ekstrahiranih trajektorijah gibanja iz velike zbirke resničnih video sekvenc. Izurjen model, pogojen z vhodno sliko, napove nevronsko stohastično teksturo gibanja: nabor koeficientov osnove gibanja, ki označujejo pot vsake slikovne pike v prihodnost.

Osnova te inovacije je natančno izurjen model. Googlov model se uči iz obsežnega nabora podatkov o trajektorijah gibanja, pridobljenih iz resničnih video sekvenc, ki prikazujejo naravno, nihajoče gibanje. Te sekvence vključujejo prizore z elementi, kot so majanje dreves, premikanje rož, utripanje sveč in oblačila, ki se valovijo v vetru. Ta raznolik nabor podatkov omogoča modelu razumevanje širokega nabora dinamičnih vedenj.

Obseg študije je omejen na prizore iz resničnega sveta z naravno, nihajočo dinamiko, kot so drevesa in rože, ki se premikajo v vetru. Fourierjeva vrsta je izbrana kot osnovna funkcija. Nastale frekvenčno-prostorske teksture je mogoče nato preoblikovati v goste krivulje gibanja slikovnih pik z dolgim ​​dosegom, ki jih je mogoče uporabiti za sintetiziranje prihodnjih okvirjev in spreminjanje nepremičnih slik v realistične animacije.

Ko je predstavljen z a ena sama slika, usposobljeni model uporablja frekvenčno usklajen postopek vzorčenja difuzije. Ta postopek napove dolgoročno predstavitev gibanja na slikovno piko v Fourierjevi domeni, imenovano nevronska stohastična tekstura gibanja. Ta predstavitev se nato pretvori v zgoščene trajektorije gibanja, ki zajemajo celoten video. Skupaj z modulom za upodabljanje, ki temelji na slikah, je mogoče te trajektorije izkoristiti za različne praktične aplikacije.

V primerjavi s prednostmi pred neobdelanimi slikovnimi pikami RGB prednosti pred zajemanjem gibanja zajamejo bolj temeljno, nizkodimenzionalno poddimenzionalno strukturo, ki učinkovito pojasnjuje razlike v vrednostih slikovnih pik. To vodi do bolj skladnega dolgoročnega ustvarjanja in bolj natančnega nadzora nad animacijami v primerjavi s prejšnjimi metodami, ki izvajajo slikovna animacija prek neobdelane video sinteze.

Ustvarjena predstavitev gibanja je priročna za številne nadaljnje aplikacije, kot je ustvarjanje brezšivnih videoposnetkov v zanki, urejanje ustvarjenega gibanja in omogočanje interaktivnih dinamične slike, ki simulira odziv dinamike objekta na sile, ki jih izvaja uporabnik.

Preberite več povezanih tem:

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

več člankov
Damir Yalalov
Damir Yalalov

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

Od valovanja do velikega zelenega DAO: Kako projekti kriptovalut prispevajo k dobrodelnosti

Raziščimo pobude, ki izkoriščajo potencial digitalnih valut za dobrodelne namene.

Več o tem

AlphaFold 3, Med-Gemini in drugi: način, kako umetna inteligenca spremeni zdravstveno varstvo leta 2024

Umetna inteligenca se v zdravstvu kaže na različne načine, od odkrivanja novih genetskih povezav do opolnomočenja robotskih kirurških sistemov ...

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
10 najboljših brezplačnih orodij z umetno inteligenco za ustvarjanje vsebine, urejanje videa in drugo
AI Wiki prebaviti Izobraževanje Življenjski slog Software Tehnologija
10 najboljših brezplačnih orodij z umetno inteligenco za ustvarjanje vsebine, urejanje videa in drugo
Maj 14, 2024
Hongkonška komisija za vrednostne papirje svari pred prevarami Deepfake, ki ciljajo na kriptoindustrijo: Posledice za varnost vlagateljev
Življenjski slog Varnost Wiki Software Zgodbe in ocene Tehnologija
Hongkonška komisija za vrednostne papirje svari pred prevarami Deepfake, ki ciljajo na kriptoindustrijo: Posledice za varnost vlagateljev
Maj 14, 2024
Ripple in Evmos sodelujeta pri razvoju stranske verige XRP Ledger EVM s tehnologijo EvmOS
ŽELITE POSTATI PARTNER Novice Tehnologija
Ripple in Evmos sodelujeta pri razvoju stranske verige XRP Ledger EVM s tehnologijo EvmOS
Maj 14, 2024
5ireChain sproži spodbujen 'Testnet Thunder: GA' za stresno testiranje omrežja, uporabnike vabi k sodelovanju za Airdrop Nagrade
Novice Tehnologija
5ireChain sproži spodbujen 'Testnet Thunder: GA' za stresno testiranje omrežja, uporabnike vabi k sodelovanju za Airdrop Nagrade
Maj 14, 2024
CRYPTOMERIA LABS PTE. LTD.