Microsoft a lansat un model de difuzie care poate construi un avatar 3D dintr-o singură fotografie a unei persoane
Pe scurt
O singură imagine 2D a feței unei persoane poate fi utilizată pentru a genera un avatar 3D folosind tehnica de învățare automată a difuzării avatarului 3D.
Poate fi folosit pentru a oferi o vedere 3D realistă a persoanei pentru jocuri sau alte utilizări sau pentru a oferi o experiență de realitate virtuală (VR) sau realitate augmentată (AR).
3D Avatar Diffusion este un algoritm de învățare automată care poate lua o singură imagine 2D a unei fețe umane și poate crea un avatar tridimensional (3D). Avatarul poate fi apoi folosit pentru a crea o experiență de realitate virtuală (VR) sau de realitate augmentată (AR) sau pur și simplu pentru a oferi o vedere 3D realistă a persoanei pentru jocuri sau alte scopuri.
Modelul de difuzie a fost dezvoltat de o echipă de cercetători de la Microsoft Research și este descrisă într-o lucrare publicată în jurnal arXiv.
3D Avatar Diffusion se bazează pe un tip de algoritm de învățare automată numit model de difuzie. Modelele de difuzie sunt modele generative, ceea ce înseamnă că pot genera date noi care sunt similare cu datele de antrenament. Modele de difuzie au fost folosite anterior pentru a genera imagini 3D din imagini 2D, dar ADM este primul model de difuzie care poate genera un avatar 3D realist dintr-o singură imagine 2D.
Pentru a antrena modelul, cercetătorii au folosit un set de date de peste 200,000 de modele de fețe 3D. Setul de date a inclus o mare varietate de fețe cu diferite nuanțe de piele, coafuri și trăsături faciale. ADM a putut apoi să învețe relația dintre imaginea 2D și modelul feței 3D și să genereze un avatar 3D realist dintr-o singură imagine 2D.
Modelul poate fi folosit și pentru a genera un avatar dintr-o fotografie care a fost făcută dintr-un unghi diferit
Acest studiu propune un model generativ 3D care creează automat avatare digitale 3D care sunt reprezentate ca câmpuri de radiație neuronale folosind modele de difuzie. Din cauza cerințelor prohibitive de memorie și procesare asociate cu 3D, crearea funcțiilor bogate necesare pentru avatare de înaltă calitate este o problemă uriașă. Dezvoltatorii sugerează că rețeaua de difuzare de lansare (Rodin) abordează această problemă.
Această rețea desfășoară numeroase hărți de caracteristici 2D ale unui câmp de radiație neural într-un singur plan de caracteristici 2D, unde modelul execută apoi difuzarea conștientă de 3D. Modelul Rodin folosește convoluția 3D-aware, care se ocupă de caracteristicile proiectate în planul caracteristicilor 2D în conformitate cu relația lor originală în 3D, pentru a oferi eficiența computațională atât de necesară, menținând în același timp integritatea difuziei în 3D.
Citiți mai multe despre AI:
Declinare a responsabilităţii
În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.
Despre autor
Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului.
Mai multe articoleDamir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului.