Uudiste reportaaž Tehnoloogia
Jaanuar 24, 2023

VToonify: reaalajas tehisintellekti mudel kunstiliste portreevideote loomiseks

Põgusalt

Arendajad töötasid välja revolutsioonilise VToonify raamistiku, et pakkuda kontrollitud kõrge eraldusvõimega portreevideo stiilis ülekandeid.

Vapustavate kunstiliste portreede loomiseks kasutab raamistik StyleGANi keskmise ja kõrge eraldusvõimega kihte.

See võimaldab laiendada olemasolevat StyleGAN-põhist pildi toonisatsiooni mudelid videole.

Nanyangi tehnikaülikooli teadlased on seda teinud tutvustas uudset VToonify raamistikku juhitava kõrge eraldusvõimega portreevideo stiilis ülekande genereerimiseks. VToonify kasutab StyleGANi keskmise ja kõrge eraldusvõimega kihte, et renderdada kvaliteetseid kunstilisi portreesid, mis põhinevad kodeerija eraldatud mitmeskaalulistel sisufunktsioonidel, et kaadri detaile paremini säilitada. Katsetulemused näitavad, et meie raamistik suudab genereerida püsivalt kõrge kvaliteediga ja soovitud näoilmetega videoid ilma näo joondamise või kaadri suuruse piiranguteta.

Selle tulemusel loob täielikult konvolutsiooniline arhitektuur, mis aktsepteerib erineva suurusega videotes joondamata nägusid, terviklikke orgaaniliste liikumistega nägusid. VToonify raamistik pärib nende mudelite ahvatlevad omadused värvide ja intensiivsuse paindlikuks stiilijuhtimiseks. See ühildub olemasolevate StyleGAN-põhiste kujutise tooniseerimismudelitega, et laiendada neid video tooniseerimisele. See töö tutvustab kahte VToonify eksemplari vastavalt kollektsioonipõhiseks ja näidispõhiseks portreevideo stiilis edastamiseks, mis on üles ehitatud Toonifyle ja DualStyleGANile.

Vtoonify: reaalajas tehisintellekti mudel kunstiliste portreevideote loomiseks

Ulatuslikud katsetulemused näitavad, et väljapakutud VToonify raamistik ületab konkureerivaid lähenemisviise reguleeritava stiili juhtnuppudega kunstiliste portreefilmide tootmisel, mis on suurepärase kvaliteediga ja ajaliselt ühtsed. Kontrollima GitHub rohkem üksikasju.

Seotud artikkel: OpenAI tegeleb videote jaoks tehisintellekti mudeli loomisega

Kontrollitava kõrge eraldusvõimega portreevideo stiiliülekande pakkumiseks ühendab VToonify pilditõlkeraamistiku ja StyleGAN-põhise raamistiku eelised.

(A) Muutuva sisendsuuruse toetamiseks kasutab piltide tõlkimise süsteem täielikult konvolutsioonivõrke. Sellegipoolest on nullist õpetades keeruline edasi anda kõrget eraldusvõimet ja kontrollitud stiili.

(B) StyleGAN-il põhinev raamistik, mis toetab ainult fikseeritud pildi suurust ja detailide kadu, kasutab kõrge eraldusvõimega ja juhitava stiili edastamiseks eelkoolitatud StyleGAN-mudelit.

(C) Piltide tõlkimise raamistikuga sarnaneva täiesti konvolutsioonilise kodeerija-generaatori arhitektuuri loomiseks laiendab meie hübriidsüsteem StyleGAN-i, kustutades selle fikseeritud suurusega sisendfunktsiooni ja madala eraldusvõimega kihid.

Kaadri üksikasjade säilitamiseks koolitavad arendajad kodeerijat välja võtma sisendraamist täiendava sisutingimusena mitmemõõtmelisi sisufunktsioone. VToonify pärib StyleGAN-i mudeli stiilijuhtimise paindlikkuse, pannes selle generaatorisse nii andmete kui ka mudeli destilleerimiseks.

Vtoonify: reaalajas tehisintellekti mudel kunstiliste portreevideote loomiseks
Seotud artikkel: Lambda Labs teatas AI-pildimikserist, mis suudab kombineerida kuni viis pilti

VToonify raamistik pärib praegustelt StyleGAN-põhistelt kujutiste tooniseerimismudelitelt paindliku stiilijuhtimise ahvatlevad omadused ja ühildub nendega, et neid laiendada. video toonimine. Meie VToonify pakub DualStyleGAN-i mudelit StyleGAN-i alusena järgmist:

  • Stiili ülekandmine eeskujupõhistest struktuuridest;
  • Stiiliastme muutmine;
  • Värvistiili ülekandmine näidiste põhjal.
Vtoonify: reaalajas tehisintellekti mudel kunstiliste portreevideote loomiseks
StyleGANi destilleerimiseks võrdlevad arendajad kahte selgroogu Toonify ja DualStyleGAN, samuti kõrgresolutsiooniga pildist pildiks tõlkimise baasjoont Pix2pixHD. VToonify-T ja VToonify-D ületavad kogu video stiliseerimise poolest võrreldavaid selgroogu Toonify ja DualStyleGAN, säilitades samas iga üksiku kaadri selgroogsed kvaliteetsed ja visuaalsed elemendid. Näiteks VToonify-T järgib Toonify't, et avaldada tugevat stiiliefekti, nagu näiteks violetsed juuksed Arcane'i stiilis. VToonify-D aga teeb näojoonte säilitamisega paremini hakkama. Võrreldes VToonify-D-ga on Pix2pixHD-l virvendus ja artefakte.

Loe AI kohta lähemalt:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Veel artikleid
Damir Jalalov
Damir Jalalov

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Hot Stories
Liituge meie uudiskirjaga.
Uudised

Karistuspäev saabub: CZ saatus on tasakaalus, kuna USA kohus võtab DOJ palvet arvesse

Changpeng Zhao ootab täna ees kohtuotsus USA Seattle'i kohtus.

Rohkem teada

Samourai rahakoti asutajaid süüdistatakse Darkneti tehingute 2 miljardi dollari suuruse hõlbustamises

Samourai Walleti asutajate kartus on tööstuse jaoks märkimisväärne tagasilöök, mis rõhutab püsivat ...

Rohkem teada
Liituge meie uuendusliku tehnikakogukonnaga
Loe rohkem
Loe edasi
AltLayer siseneb panustamisalgatuse teise faasi, tutvustab reALT-märki
turud Uudiste reportaaž Tehnoloogia
AltLayer siseneb panustamisalgatuse teise faasi, tutvustab reALT-märki
Võib 2 2024
BNB keti 1. aasta I kvartali aruanne tõstab esile 2024% väärtuse vähenemise, samas kui BSC TVL tõuseb 55.8%
turud Uudiste reportaaž Tehnoloogia
BNB keti 1. aasta I kvartali aruanne tõstab esile 2024% väärtuse vähenemise, samas kui BSC TVL tõuseb 55.8%
Võib 2 2024
Naver ja Kakao Kaia: uus Aasia plokiahela jõujaam on valmis häirima globaalseid krüptoturge
Äri tarkvara Lood ja ülevaated Tehnoloogia
Naver ja Kakao Kaia: uus Aasia plokiahela jõujaam on valmis häirima globaalseid krüptoturge
Võib 2 2024
Aave Labs avalikustab 'Aave 2030' ettepaneku, mis sisaldab Aave V4 protokolli käivitamist
Äri Uudiste reportaaž Tehnoloogia
Aave Labs avalikustab 'Aave 2030' ettepaneku, mis sisaldab Aave V4 protokolli käivitamist
Võib 2 2024
CRYPTOMERIA LABS PTE. LTD.