Uutisraportti Elektroniikka
Syyskuu 19, 2023

Google esittelee innovatiivisen generatiivisen kuvadynamiikan, joka simuloi dynaamisia kohtauksia staattisissa kuvissa

Google on julkistanut a Generatiivinen kuvadynamiikka, uusi lähestymistapa mahdollistaa muuntamisen a yksittäinen staattinen kuva saumattomaksi silmukkavideoksi tai interaktiivinen dynaaminen kohtaus, joka tarjoaa laajan valikoiman käytännön sovelluksia.

Google esittelee innovatiivisen generatiivisen kuvadynamiikan, joka simuloi dynaamisia kohtauksia staattisissa kuvissa

Tämän uraauurtavan tekniikan ytimessä on kuva-avaruuden mallinnus ennen kohtauksen dynamiikkaa. Tavoitteena on luoda kattava käsitys siitä, kuinka kuvan esineet ja elementit voivat käyttäytyä erilaisissa dynaamisissa vuorovaikutuksissa. Tätä ymmärrystä voidaan sitten käyttää simuloimaan tehokkaasti objektidynamiikan vastetta käyttäjän vuorovaikutukseen.

Tämän tekniikan tärkein ominaisuus on kyky luoda saumattomia silmukkavideoita. Hyödyntämällä kuva-avaruutta ennen kohtauksen dynamiikkaa Googlen järjestelmä voi ekstrapoloida ja laajentaa elementtien liikettä kuvan sisällä ja muuttaa sen kiehtovaksi ja jatkuvaksi videosilmukaksi. Tämä toiminnallisuus avaa lukuisia luovia mahdollisuuksia sisällöntuottajille ja suunnittelijoille.

Artikkelissa esitellään kohtausdynamiikkaan perustuva lähestymistapa kuva-avaruuspriorien mallintamiseen, joka on opittu kokoelmasta liikeratoja, jotka on poimittu todellisista videojaksoista, jotka sisältävät luonnollista, värähtelevää liikettä, kuten puita, kukkia, kynttilöitä ja tuulessa puhaltavia vaatteita. . Koulutettu malli käyttää taajuuskoordinoitua diffuusionäytteistysprosessia ennustamaan pikselikohtaista pitkän aikavälin liikeesitystä Fourier-alueella, jota he kutsuvat hermostokastiseksi liiketekstuuriksi. Tämä esitys voidaan muuntaa tiheäksi liikeradalle, joka kattaa koko videon.

Teknologian avulla käyttäjät voivat olla vuorovaikutuksessa staattisten kuvien esineiden kanssa realistisesti. Simuloimalla objektin dynamiikan vastetta käyttäjän herätteeseen Googlen järjestelmä mahdollistaa mukaansatempaavia ja interaktiivisia kokemuksia kuvien sisällä. Tällä on potentiaalia mullistaa metaversaaliset tilat ja kuinka käyttäjät sitoutuvat visuaaliseen sisältöön.

Tutkimuksessa tarkastellaan generatiivisen priorin mallintamista kuva-avaruuden kohtausliikkeelle, eli yhden kuvan kaikkien pikselien liikkeelle. Malli on koulutettu automaattisesti poimittujen liikeratojen avulla suuresta kokoelmasta todellisia videojaksoja. Syötekuvaan ehdolla koulutettu malli ennustaa hermoston stokastisen liiketekstuurin: joukon liikepohjan kertoimia, jotka luonnehtivat kunkin pikselin liikeradan tulevaisuuteen.

Tämän innovaation perusta on huolellisesti koulutettu malli. Googlen malli oppii valtavasta liikeratojen tietojoukosta, joka on poimittu todellisista videojaksoista, joissa esiintyy luonnollista, värähtelevää liikettä. Näissä jaksoissa on kohtauksia, joissa on elementtejä, kuten puiden heilumista, kukkien liikkumista, kynttilöiden välkkymistä ja vaatteiden tuulessa heilumista. Tämä monipuolinen tietojoukko mahdollistaa sen, että malli ymmärtää monenlaisia ​​dynaamisia käyttäytymismalleja.

Tutkimus rajoittuu tosielämän kohtauksiin, joissa on luonnollista, värähtelevää dynamiikkaa, kuten tuulessa liikkuvia puita ja kukkia. Fourier-sarja valitaan perusfunktioiksi. Tuloksena saadut taajuusavaruustekstuurit voidaan sitten muuntaa tiheiksi, pitkän kantaman pikselien liikeratoja, joita voidaan käyttää syntetisoimaan tulevia kehyksiä ja muuttamaan still-kuvia realistisiksi animaatioiksi.

Kun esitetään a yksi kuva, koulutettu malli käyttää taajuuskoordinoitua diffuusionäytteenottoprosessia. Tämä prosessi ennustaa pikselikohtaisen pitkän aikavälin liikeesityksen Fourier-alueella, jota kutsutaan hermostokastiseksi liiketekstuuriksi. Tämä esitys muunnetaan sitten tiheäksi liikeradalle, joka kattaa koko videon. Yhdessä kuvapohjaisen renderöintimoduulin kanssa nämä liikeradat voidaan valjastaa erilaisiin käytännön sovelluksiin.

Verrattuna raaka-RGB-pikseleihin verrattuna, liikkeen kaappaamisen edellytyksenä on perustavanlaatuisempi, pienempiulotteinen aliulotteinen rakenne, joka selittää tehokkaasti pikseliarvojen vaihtelut. Tämä johtaa johdonmukaisempaan pitkän aikavälin luomiseen ja tarkempaan animaatioiden hallintaan verrattuna aikaisempiin menetelmiin, jotka suorittavat kuvaanimaatio raakavideosynteesin kautta.

Luotu liikeesitys on kätevä useissa loppupään sovelluksissa, kuten saumattomien silmukkavideoiden luomiseen, luodun liikkeen muokkaamiseen ja interaktiivisen toiminnan mahdollistamiseen. dynaamisia kuvia, simuloi objektidynamiikan vastetta käyttäjän soveltamiin voimiin.

Lue lisää aiheeseen liittyvistä aiheista:

Vastuun kieltäminen

Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.

Author

Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa. 

lisää artikkeleita
Damir Yalalov
Damir Yalalov

Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa. 

Ripplesta The Big Green DAO:hon: Kuinka kryptovaluuttaprojektit edistävät hyväntekeväisyyttä

Tutkitaan aloitteita, joilla hyödynnetään digitaalisten valuuttojen potentiaalia hyväntekeväisyyteen.

Tiedä enemmän

AlphaFold 3, Med-Gemini ja muut: The Way AI Transforms Healthcare vuonna 2024

Tekoäly ilmenee monin eri tavoin terveydenhuollossa, uusien geneettisten korrelaatioiden paljastamisesta robottikirurgisten järjestelmien voimaannuttamiseen...

Tiedä enemmän
Liity innovatiiviseen teknologiayhteisöömme
Lue lisää
Lue lisää
Ripplesta The Big Green DAO:hon: Kuinka kryptovaluuttaprojektit edistävät hyväntekeväisyyttä
analyysi Crypto Wiki Bisnes koulutus Lifestyle markkinat Tuotteemme Elektroniikka
Ripplesta The Big Green DAO:hon: Kuinka kryptovaluuttaprojektit edistävät hyväntekeväisyyttä
Voi 13, 2024
AlphaFold 3, Med-Gemini ja muut: The Way AI Transforms Healthcare vuonna 2024
AI Wiki analyysi Sulattaa Lausunto Bisnes markkinat Uutisraportti Tuotteemme Tarinoita ja arvosteluja Elektroniikka
AlphaFold 3, Med-Gemini ja muut: The Way AI Transforms Healthcare vuonna 2024
Voi 13, 2024
Nim Network ottaa käyttöön tekoälyn omistajuuden tokenointikehyksen ja toteuttaa tuottomyynnin tilannekuvan päivämäärän kanssa toukokuussa
markkinat Uutisraportti Elektroniikka
Nim Network ottaa käyttöön tekoälyn omistajuuden tokenointikehyksen ja toteuttaa tuottomyynnin tilannekuvan päivämäärän kanssa toukokuussa
Voi 13, 2024
Binance tekee yhteistyötä Argentiinan kanssa kyberrikollisuuden torjumiseksi
Lausunto Bisnes markkinat Uutisraportti Tuotteemme Elektroniikka
Binance tekee yhteistyötä Argentiinan kanssa kyberrikollisuuden torjumiseksi
Voi 13, 2024
CRYPTOMERIA LABS PTE. OY.