Uutisraportti Elektroniikka
Tammikuu 24, 2023

VToonify: Reaaliaikainen tekoälymalli taiteellisten muotokuvavideoiden luomiseen

Lyhyesti

Kehittäjät ovat kehittäneet vallankumouksellisen VToonify-kehyksen tarjoamaan ohjattuja, korkearesoluutioisia muotokuvavideotyylisiä siirtoja.

Kehys hyödyntää StyleGANin keski- ja korkearesoluutioisia tasoja upeiden taiteellisten muotokuvien tuottamiseksi.

Se mahdollistaa olemassa olevan StyleGAN-pohjaisen laajentamisen kuvan toonisointimallit videolle.

Nanyangin teknillisen yliopiston tutkijat ovat esitteli uuden VToonify-kehyksen ohjattavan korkearesoluutioisen muotokuvavideotyylisen siirron luomiseen. VToonify hyödyntää StyleGANin keski- ja korkearesoluutioisia kerroksia tuottaakseen korkealaatuisia taiteellisia muotokuvia, jotka perustuvat kooderin poimimiin monimuotoisiin sisältöominaisuuksiin, jotta kehyksen yksityiskohdat säilyvät paremmin. Kokeilutulokset osoittavat, että kehyksellämme voidaan luoda jatkuvasti korkealaatuisia videoita ja haluttuja ilmeitä ilman kasvojen kohdistusta tai kehyskokorajoituksia.

Tämän seurauksena täysin konvoluutioarkkitehtuuri, joka hyväksyy erikokoisissa videoissa kohdistamattomat kasvot, tuottaa täydelliset kasvot orgaanisilla liikkeillä. VToonify-kehys perii näiden mallien houkuttelevat ominaisuudet, jotka mahdollistavat joustavan värin ja intensiteetin tyylin hallinnan. Se on yhteensopiva olemassa olevien StyleGAN-pohjaisten kuvan toonisointimallien kanssa laajentaakseen ne videon toonisointiin. Tämä teos esittelee kaksi VToonifyn ilmentymää kokoelmapohjaiseen ja esimerkkipohjaiseen muotokuvatyylien siirtoon, vastaavasti Toonifyn ja DualStyleGANin pohjalta.

Vtoonify: Reaaliaikainen tekoälymalli taiteellisten muotokuvavideoiden luomiseen

Laajat kokeelliset havainnot osoittavat, että ehdotettu VToonify-kehys ylittää kilpailevat lähestymistavat taiteellisten muotokuvaelokuvien tuottamisessa säädettävillä tyylisäätimillä, jotka ovat erinomaisen laadukkaita ja ajallisesti yhdenmukaisia. Tarkistaa GitHub lisätietoja.

Aiheeseen liittyvä artikkeli: OpenAI työskentelee tekoälymallin luomiseksi videolle

Tarjotakseen hallittavan korkearesoluutioisen muotokuvan tyylin siirron VToonifyssa yhdistyvät kuvan käännöskehyksen ja StyleGAN-pohjaisen viitekehyksen edut.

(A) Vaihtuvan syöttökoon tukemiseksi kuvankäännösjärjestelmä käyttää täysin konvoluutioverkkoja. Korkearesoluutioinen ja hallittu tyyli on kuitenkin haastavaa, kun opetetaan tyhjästä.

(B) StyleGAN-pohjainen kehys, joka tukee vain kiinteää kuvakokoa ja yksityiskohtahäviöitä, käyttää esikoulutettua StyleGAN-mallia korkean resoluution ja ohjattavan tyylin siirtoon.

(C) Luodakseen täysin konvoluutiota kuvaavan enkooderi-generaattori-arkkitehtuurin, joka muistuttaa kuvansiirtokehystä, hybridijärjestelmämme laajentaa StyleGANia poistamalla sen kiinteän kokoisen syöttöominaisuuden ja matalan resoluution kerrokset.

Kehyksen yksityiskohtien säilyttämiseksi kehittäjät kouluttavat kooderin poimimaan monimuotoisia sisältöominaisuuksia syöttökehyksestä lisäsisältöehtona. VToonify perii StyleGAN-mallin tyylinhallinnan joustavuuden asettamalla sen generaattoriin tislaamaan sekä sen tiedot että mallin.

Vtoonify: Reaaliaikainen tekoälymalli taiteellisten muotokuvavideoiden luomiseen
Aiheeseen liittyvä artikkeli: Lambda Labs julkisti tekoälykuvamikserin, joka voi yhdistää jopa viisi kuvaa

VToonify-kehys perii houkuttelevat ominaisuudet joustavaan tyylinhallintaan nykyisistä StyleGAN-pohjaisista kuvan toonisointimalleista ja on yhteensopiva niiden kanssa laajentaakseen niitä video- toonisointi. VToonifymme tarjoaa seuraavat käyttämällä DualStyleGAN-mallia StyleGAN-perustana:

  • Tyylin siirto esimerkillisistä rakenteista;
  • Tyyliasteen muuttaminen;
  • Värityylin siirto esimerkkien perusteella.
Vtoonify: Reaaliaikainen tekoälymalli taiteellisten muotokuvavideoiden luomiseen
StyleGAN-tislauksessa kehittäjät vertaavat kahta runkorakennetta Toonifya ja DualStyleGANia sekä korkearesoluutioista kuvasta kuvaksi -muunnoksen peruslinjaa Pix2pixHD. VToonify-T ja VToonify-D ylittävät vertailukelpoiset runkoverkot, Toonify ja DualStyleGAN, koko videon tyyliteltäessä säilyttäen samalla korkean laadun ja visuaaliset elementit kuin kunkin yksittäisen kehyksen rungot. Esimerkiksi VToonify-T seuraa Toonifya luodakseen voimakkaan tyyliefektin, kuten violetit hiukset Arcane-tyyliin. VToonify-D puolestaan ​​hoitaa kasvojen piirteet paremmin. Pix2pixHD:ssä on välkkymiä ja artefakteja verrattuna VToonify-D:hen.

Lue lisää tekoälystä:

Vastuun kieltäminen

Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.

Author

Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa. 

lisää artikkeleita
Damir Yalalov
Damir Yalalov

Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa. 

Tuomiopäivä saapuu: CZ:n kohtalo on tasapainossa, kun Yhdysvaltain tuomioistuin harkitsee DOJ:n vetoomusta

Changpeng Zhao odottaa tänään tuomiota Yhdysvaltain oikeudessa Seattlessa.

Tiedä enemmän

Samourai Walletin perustajia syytetään 2 miljardin dollarin helpottamisesta Darknet-kaupoissa

Samourai Walletin perustajien pelko on huomattava takaisku teollisuudelle, mikä korostaa jatkuvaa ...

Tiedä enemmän
Liity innovatiiviseen teknologiayhteisöömme
Lue lisää
Lue lisää
AltLayer siirtyy panostusaloitteensa toiseen vaiheeseen, esittelee real ALT Tokenin
markkinat Uutisraportti Elektroniikka
AltLayer siirtyy panostusaloitteensa toiseen vaiheeseen, esittelee real ALT Tokenin
Voi 2, 2024
BNB-ketjun 1 ensimmäisen vuosineljänneksen raportissa korostetaan 2024 prosentin arvonmenetystä, kun taas BSC TVL nousi 55.8 prosenttia
markkinat Uutisraportti Elektroniikka
BNB-ketjun 1 ensimmäisen vuosineljänneksen raportissa korostetaan 2024 prosentin arvonmenetystä, kun taas BSC TVL nousi 55.8 prosenttia
Voi 2, 2024
Naver ja Kakao's Kaia: Uusi Aasian Blockchain Powerhouse on valmis häiritsemään globaaleja kryptomarkkinoita
Bisnes Tuotteemme Tarinoita ja arvosteluja Elektroniikka
Naver ja Kakao's Kaia: Uusi Aasian Blockchain Powerhouse on valmis häiritsemään globaaleja kryptomarkkinoita
Voi 2, 2024
Aave Labs julkistaa "Aave 2030" -ehdotuksen, joka sisältää Aave V4 -protokollan julkaisun
Bisnes Uutisraportti Elektroniikka
Aave Labs julkistaa "Aave 2030" -ehdotuksen, joka sisältää Aave V4 -protokollan julkaisun
Voi 2, 2024
CRYPTOMERIA LABS PTE. OY.