Google tutvustab uuenduslikku generatiivset pildidünaamikat, mis simuleerib staatiliste piltide dünaamilisi stseene
Google on avalikustanud a Generatiivne pildidünaamika, uudne lähenemine võimaldab teisendada a üks staatiline pilt sujuvaks silmusvideoks või interaktiivne dünaamiline stseen, mis pakub laia valikut praktilisi rakendusi.
Selle teedrajava tehnoloogia keskmes on pildiruumi modelleerimine enne stseeni dünaamikat. Eesmärk on luua terviklik arusaam sellest, kuidas pildil olevad objektid ja elemendid võivad erinevate dünaamiliste interaktsioonide korral käituda. Seda arusaama saab seejärel kasutada objekti dünaamika reaktsiooni tõhusaks simuleerimiseks kasutaja interaktsioonidele.
Selle tehnoloogia põhifunktsiooniks on võimalus luua sujuvaid silmusvideoid. Kasutades enne stseeni dünaamikat pildiruumi, saab Google'i süsteem ekstrapoleerida ja laiendada pildi elementide liikumist, muutes selle põnevaks ja pidevaks videotsükliks. See funktsioon avab sisuloojatele ja kujundajatele arvukalt loomingulisi võimalusi.
Tehnoloogia võimaldab kasutajatel staatiliste piltide objektidega realistlikult suhelda. Simuleerides objekti dünaamika reaktsiooni kasutaja ergastusele, võimaldab Google'i süsteem seda kaasahaaravad ja interaktiivsed kogemused piltide sees. Sellel on revolutsiooni potentsiaal metaverssed ruumid ja kuidas kasutajad visuaalse sisuga suhtlevad.
Selle uuenduse aluseks on hoolikalt koolitatud mudel. Google'i mudel õpib tohutust liikumistrajektooride andmekogumist, mis on eraldatud tõelistest videoseeriatest, mis sisaldavad loomulikku võnkuvat liikumist. Need jadad hõlmavad stseene selliste elementidega nagu puude õõtsumine, lillede liikumine, küünalde värelemine ja riided tuules lainetavad. See mitmekesine andmestik võimaldab mudelil mõista mitmesuguseid dünaamilisi käitumisviise.
Kui esitatakse a üksik pilt, kasutab koolitatud mudel sagedusega koordineeritud difusiooniproovi võtmise protsessi. See protsess ennustab pikaajalist liikumist piksli kohta Fourier' domeenis, mida nimetatakse neuraalseks stohhastiliseks liikumise tekstuuriks. See esitus muundatakse seejärel tihedateks liikumistrajektoorideks, mis hõlmavad tervet videot. Koos pildipõhise renderdusmooduliga saab neid trajektoore kasutada mitmesuguste praktiliste rakenduste jaoks.
Võrreldes RGB töötlemata pikslite eelistega, jäädvustavad prioriteedid liikumise ees fundamentaalsemat, madalama mõõtmega alamõõtmelist struktuuri, mis selgitab tõhusalt piksliväärtuste variatsioone. See toob kaasa sidusama pikaajalise genereerimise ja täpsema kontrolli animatsioonide üle võrreldes varasemate meetoditega, mis toimivad. pildianimatsioon töötlemata video sünteesi kaudu.
Loodud liikumise esitus on mugav mitmete allavoolu rakenduste jaoks, näiteks sujuvate silmusvideote loomiseks, genereeritud liikumise redigeerimiseks ja interaktiivsete funktsioonide võimaldamiseks. dünaamilised pildid, simuleerides objekti dünaamika reaktsiooni kasutaja poolt rakendatavatele jõududele.
Loe rohkem seotud teemasid:
Kaebused
Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.
Umbes Autor
Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks.
Veel artikleidDamir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks.