Buletin de stiri Tehnologia
Ianuarie 18, 2023

Microsoft a lansat un model de difuzie care poate construi un avatar 3D dintr-o singură fotografie a unei persoane

Pe scurt

O singură imagine 2D a feței unei persoane poate fi utilizată pentru a genera un avatar 3D folosind tehnica de învățare automată a difuzării avatarului 3D.

Poate fi folosit pentru a oferi o vedere 3D realistă a persoanei pentru jocuri sau alte utilizări sau pentru a oferi o experiență de realitate virtuală (VR) sau realitate augmentată (AR).

3D Avatar Diffusion este un algoritm de învățare automată care poate lua o singură imagine 2D a unei fețe umane și poate crea un avatar tridimensional (3D). Avatarul poate fi apoi folosit pentru a crea o experiență de realitate virtuală (VR) sau de realitate augmentată (AR) sau pur și simplu pentru a oferi o vedere 3D realistă a persoanei pentru jocuri sau alte scopuri.

Modelul de difuzie a fost dezvoltat de o echipă de cercetători de la Microsoft Research și este descrisă într-o lucrare publicată în jurnal arXiv.

Microsoft a lansat un model de difuzie care poate construi un avatar 3D dintr-o singură fotografie a unei persoane

3D Avatar Diffusion se bazează pe un tip de algoritm de învățare automată numit model de difuzie. Modelele de difuzie sunt modele generative, ceea ce înseamnă că pot genera date noi care sunt similare cu datele de antrenament. Modele de difuzie au fost folosite anterior pentru a genera imagini 3D din imagini 2D, dar ADM este primul model de difuzie care poate genera un avatar 3D realist dintr-o singură imagine 2D.

Pentru a antrena modelul, cercetătorii au folosit un set de date de peste 200,000 de modele de fețe 3D. Setul de date a inclus o mare varietate de fețe cu diferite nuanțe de piele, coafuri și trăsături faciale. ADM a putut apoi să învețe relația dintre imaginea 2D și modelul feței 3D și să genereze un avatar 3D realist dintr-o singură imagine 2D.

Modelul poate fi folosit și pentru a genera un avatar dintr-o fotografie care a fost făcută dintr-un unghi diferit

Pentru avatarul 3D personalizat, modelul Rodin oferă manipulare ghidată de text. Editarea în limbaj natural este o modalitate intuitivă de a schimba multe caracteristici diferite de avatar 3D.

Acest studiu propune un model generativ 3D care creează automat avatare digitale 3D care sunt reprezentate ca câmpuri de radiație neuronale folosind modele de difuzie. Din cauza cerințelor prohibitive de memorie și procesare asociate cu 3D, crearea funcțiilor bogate necesare pentru avatare de înaltă calitate este o problemă uriașă. Dezvoltatorii sugerează că rețeaua de difuzare de lansare (Rodin) abordează această problemă.

În ceea ce privește sexul, vârsta, rasa, expresia, accesoriile faciale etc., modelul prezintă o diversitate generațională remarcabilă.​

Această rețea desfășoară numeroase hărți de caracteristici 2D ale unui câmp de radiație neural într-un singur plan de caracteristici 2D, unde modelul execută apoi difuzarea conștientă de 3D. Modelul Rodin folosește convoluția 3D-aware, care se ocupă de caracteristicile proiectate în planul caracteristicilor 2D în conformitate cu relația lor originală în 3D, pentru a oferi eficiența computațională atât de necesară, menținând în același timp integritatea difuziei în 3D.

Citiți mai multe despre AI:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Mai multe articole
Damir Yalalov
Damir Yalalov

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Hot Stories
Alăturați-vă Newsletter-ului nostru.
Ultimele ştiri

Apetitul instituțional crește față de ETF-urile Bitcoin pe fondul volatilității

Dezvăluirile prin dosarele 13F dezvăluie investitori instituționali de seamă care se amestecă în ETF-uri Bitcoin, subliniind o acceptare tot mai mare a...

Aflați mai multe

Sosește ziua sentinței: soarta lui CZ este în echilibru, în timp ce tribunalul american ia în considerare pledoaria DOJ

Changpeng Zhao este pe cale de a fi condamnat astăzi într-un tribunal american din Seattle.

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Radiant Capital inițiază propunerea RFP-34, sugerează integrarea weETH în implementările sale Ethereum și Arbitrum
Buletin de stiri Tehnologia
Radiant Capital inițiază propunerea RFP-34, sugerează integrarea weETH în implementările sale Ethereum și Arbitrum
7 Mai, 2024
Crypto Exchange Binance va lansa noi perechi de tranzacționare și va activa roboții de tranzacționare pe 8 mai
pieţe Buletin de stiri Tehnologia
Crypto Exchange Binance va lansa noi perechi de tranzacționare și va activa roboții de tranzacționare pe 8 mai
7 Mai, 2024
Stacks, Moonriver Network, Hedera și Iron Fish vor participa la programul de amplificator interchain al Axelar
Buletin de stiri Tehnologia
Stacks, Moonriver Network, Hedera și Iron Fish vor participa la programul de amplificator interchain al Axelar
7 Mai, 2024
Tesla îmbrățișează Dogecoin: spor major pentru moneda Meme, deoarece devine o opțiune de plată pe magazinul online Tesla
pieţe Povești și recenzii Tehnologia
Tesla îmbrățișează Dogecoin: spor major pentru moneda Meme, deoarece devine o opțiune de plată pe magazinul online Tesla
7 Mai, 2024
CRYPTOMERIA LABS PTE. LTD.