Uudiste reportaaž Tehnoloogia
September 19, 2023

Google tutvustab uuenduslikku generatiivset pildidünaamikat, mis simuleerib staatiliste piltide dünaamilisi stseene

Google on avalikustanud a Generatiivne pildidünaamika, uudne lähenemine võimaldab teisendada a üks staatiline pilt sujuvaks silmusvideoks või interaktiivne dünaamiline stseen, mis pakub laia valikut praktilisi rakendusi.

Google tutvustab uuenduslikku generatiivset pildidünaamikat, mis simuleerib staatiliste piltide dünaamilisi stseene

Selle teedrajava tehnoloogia keskmes on pildiruumi modelleerimine enne stseeni dünaamikat. Eesmärk on luua terviklik arusaam sellest, kuidas pildil olevad objektid ja elemendid võivad erinevate dünaamiliste interaktsioonide korral käituda. Seda arusaama saab seejärel kasutada objekti dünaamika reaktsiooni tõhusaks simuleerimiseks kasutaja interaktsioonidele.

Selle tehnoloogia põhifunktsiooniks on võimalus luua sujuvaid silmusvideoid. Kasutades enne stseeni dünaamikat pildiruumi, saab Google'i süsteem ekstrapoleerida ja laiendada pildi elementide liikumist, muutes selle põnevaks ja pidevaks videotsükliks. See funktsioon avab sisuloojatele ja kujundajatele arvukalt loomingulisi võimalusi.

Artiklis esitatakse stseeni dünaamikal põhineva pildi-ruumi eelneva modelleerimise lähenemisviis, mida õpitakse liikumistrajektooride kogumist, mis on eraldatud reaalsetest videoseeriatest, mis sisaldavad loomulikku võnkuvat liikumist, nagu puud, lilled, küünlad ja tuules puhuvad riided. . Koolitatud mudel kasutab sagedusega koordineeritud difusiooni diskreetimisprotsessi, et ennustada piksli kohta pikaajalist liikumist Fourier' domeenis, mida nad nimetavad neuraalseks stohhastiliseks liikumise tekstuuriks. Selle esituse saab teisendada tihedateks liikumistrajektoorideks, mis hõlmavad tervet videot.

Tehnoloogia võimaldab kasutajatel staatiliste piltide objektidega realistlikult suhelda. Simuleerides objekti dünaamika reaktsiooni kasutaja ergastusele, võimaldab Google'i süsteem seda kaasahaaravad ja interaktiivsed kogemused piltide sees. Sellel on revolutsiooni potentsiaal metaverssed ruumid ja kuidas kasutajad visuaalse sisuga suhtlevad.

Uuringus uuritakse kujutise-ruumi stseeni liikumise generatiivse priori modelleerimist, st kõigi pikslite liikumist ühel pildil. Mudelit õpetatakse automaatselt ekstraheeritud liikumistrajektoore suurest tõeliste videoseeriade kollektsioonist. Sisendpildil olev treenitud mudel ennustab neuraalset stohhastilist liikumistekstuuri: liikumisaluse koefitsientide komplekti, mis iseloomustavad iga piksli trajektoori tulevikku.

Selle uuenduse aluseks on hoolikalt koolitatud mudel. Google'i mudel õpib tohutust liikumistrajektooride andmekogumist, mis on eraldatud tõelistest videoseeriatest, mis sisaldavad loomulikku võnkuvat liikumist. Need jadad hõlmavad stseene selliste elementidega nagu puude õõtsumine, lillede liikumine, küünalde värelemine ja riided tuules lainetavad. See mitmekesine andmestik võimaldab mudelil mõista mitmesuguseid dünaamilisi käitumisviise.

Uuringu ulatus piirdub loomuliku, võnkuva dünaamikaga reaalsete stseenidega, nagu tuules liikuvad puud ja lilled. Alusfunktsioonideks valitakse Fourier' seeria. Saadud sagedusruumi tekstuurid saab seejärel teisendada tihedateks pikamaa pikslite liikumistrajektoorideks, mida saab kasutada tulevaste kaadrite sünteesimiseks, muutes pildid realistlikeks animatsioonideks.

Kui esitatakse a üksik pilt, kasutab koolitatud mudel sagedusega koordineeritud difusiooniproovi võtmise protsessi. See protsess ennustab pikaajalist liikumist piksli kohta Fourier' domeenis, mida nimetatakse neuraalseks stohhastiliseks liikumise tekstuuriks. See esitus muundatakse seejärel tihedateks liikumistrajektoorideks, mis hõlmavad tervet videot. Koos pildipõhise renderdusmooduliga saab neid trajektoore kasutada mitmesuguste praktiliste rakenduste jaoks.

Võrreldes RGB töötlemata pikslite eelistega, jäädvustavad prioriteedid liikumise ees fundamentaalsemat, madalama mõõtmega alamõõtmelist struktuuri, mis selgitab tõhusalt piksliväärtuste variatsioone. See toob kaasa sidusama pikaajalise genereerimise ja täpsema kontrolli animatsioonide üle võrreldes varasemate meetoditega, mis toimivad. pildianimatsioon töötlemata video sünteesi kaudu.

Loodud liikumise esitus on mugav mitmete allavoolu rakenduste jaoks, näiteks sujuvate silmusvideote loomiseks, genereeritud liikumise redigeerimiseks ja interaktiivsete funktsioonide võimaldamiseks. dünaamilised pildid, simuleerides objekti dünaamika reaktsiooni kasutaja poolt rakendatavatele jõududele.

Loe rohkem seotud teemasid:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Veel artikleid
Damir Jalalov
Damir Jalalov

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Institutsionaalne isu kasvab volatiilsuse tõttu Bitcoini ETF-ide poole

13F-i dokumentide kaudu avaldatud teave paljastab märkimisväärsed institutsionaalsed investorid, kes tegelevad Bitcoini ETF-idega, rõhutades, et ...

Rohkem teada

Karistuspäev saabub: CZ saatus on tasakaalus, kuna USA kohus võtab DOJ palvet arvesse

Changpeng Zhao ootab täna ees kohtuotsus USA Seattle'i kohtus.

Rohkem teada
Liituge meie uuendusliku tehnikakogukonnaga
Loe rohkem
Loe edasi
Plokiahela innovatsiooni rakendamine: Saksamaa astub julge sammu tervishoiu ümberkujundamise ja tõhustatud patsiendihoolduse suunas
Elustiil turud tarkvara Lood ja ülevaated Tehnoloogia
Plokiahela innovatsiooni rakendamine: Saksamaa astub julge sammu tervishoiu ümberkujundamise ja tõhustatud patsiendihoolduse suunas
Võib 13 2024
Bitcoin Restaking Platform BounceBit käivitab Mainneti ja teatab BB märgi eraldamise
Uudiste reportaaž Tehnoloogia
Bitcoin Restaking Platform BounceBit käivitab Mainneti ja teatab BB märgi eraldamise
Võib 13 2024
L3 Blockchain Degen Chain teeb oma seisakuprobleemi lahendamiseks koostööd infrastruktuuriplatvormi kanaliga
Uudiste reportaaž Tehnoloogia
L3 Blockchain Degen Chain teeb oma seisakuprobleemi lahendamiseks koostööd infrastruktuuriplatvormi kanaliga
Võib 13 2024
Pariteedi mitme signatuuriga rahakotist pesti täna 3,050 ETH-d, mille häkkerite kontrolli all on 83,017 XNUMX ETH-d, mis tuvastab Cyversi hoiatused
turud Uudiste reportaaž Tehnoloogia
Pariteedi mitme signatuuriga rahakotist pesti täna 3,050 ETH-d, mille häkkerite kontrolli all on 83,017 XNUMX ETH-d, mis tuvastab Cyversi hoiatused
Võib 13 2024
CRYPTOMERIA LABS PTE. LTD.