Notizie Tecnologia
Gennaio 18, 2023

Microsoft ha rilasciato un modello di diffusione in grado di costruire un avatar 3D da una singola foto di una persona

In Breve

Una singola immagine 2D del volto di una persona può essere utilizzata per generare un avatar 3D utilizzando la tecnica di apprendimento automatico 3D Avatar Diffusion.

Può essere utilizzato per fornire una visione 3D realistica della persona per giochi o altri usi, o per fornire un'esperienza di realtà virtuale (VR) o realtà aumentata (AR).

3D Avatar Diffusion è un algoritmo di apprendimento automatico che può prendere una singola immagine 2D di un volto umano e creare un avatar tridimensionale (3D). L'avatar può quindi essere utilizzato per creare un'esperienza di realtà virtuale (VR) o realtà aumentata (AR) o semplicemente per fornire una visione 3D realistica della persona per giochi o altri scopi.

Il modello di diffusione era sviluppato da un team di ricercatori di Microsoft Research ed è descritto in un articolo pubblicato sulla rivista arXiv.

Microsoft ha rilasciato un modello di diffusione in grado di costruire un avatar 3D da una singola foto di una persona

La diffusione dell'avatar 3D si basa su un tipo di algoritmo di apprendimento automatico chiamato modello di diffusione. I modelli di diffusione sono modelli generativi, il che significa che possono generare nuovi dati simili ai dati di addestramento. Modelli di diffusione sono stati utilizzati in precedenza per generare immagini 3D da immagini 2D, ma l'ADM è il primo modello di diffusione in grado di generare un avatar 3D realistico da una singola immagine 2D.

Per addestrare il modello, i ricercatori hanno utilizzato un set di dati di oltre 200,000 modelli di volti 3D. Il set di dati includeva un'ampia varietà di volti con diverse tonalità della pelle, acconciature e tratti del viso. L'ADM è stato quindi in grado di apprendere la relazione tra l'immagine 2D e il modello del volto 3D e generare un avatar 3D realistico da una singola immagine 2D.

Il modello può anche essere utilizzato per generare un avatar da una foto scattata da un'angolazione diversa

Per l'avatar 3D personalizzato, il modello Rodin offre una manipolazione guidata dal testo. La modifica del linguaggio naturale è un modo intuitivo per modificare molte diverse funzionalità di avatar 3D.

Questo studio propone un modello generativo 3D che crea automaticamente avatar digitali 3D che sono rappresentati come campi di radianza neurale utilizzando modelli di diffusione. A causa della memoria proibitiva e dei requisiti di elaborazione associati al 3D, la creazione delle ricche funzionalità necessarie per avatar di alta qualità è un grosso problema. Gli sviluppatori suggeriscono che la rete di diffusione del roll-out (Rodin) risolva questo problema.

In termini di sesso, età, razza, espressione, accessori facciali, ecc., il modello mostra un'eccezionale diversità generazionale.​

Questa rete distribuisce numerose mappe di caratteristiche 2D di un campo di radianza neurale in un singolo piano di caratteristiche 2D, dove il modello esegue quindi la diffusione 3D-aware. Il modello Rodin utilizza la convoluzione 3D-aware, che si occupa delle caratteristiche proiettate nel piano delle caratteristiche 2D in base alla loro relazione originale in 3D, per fornire l'efficienza computazionale tanto necessaria mantenendo l'integrità della diffusione in 3D.

Per saperne di più sull'intelligenza artificiale:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Altri articoli
Damir Jalalov
Damir Jalalov

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Cresce l’appetito istituzionale verso gli ETF Bitcoin in un contesto di volatilità

Le informazioni fornite tramite la documentazione 13F rivelano importanti investitori istituzionali che si dilettano negli ETF Bitcoin, sottolineando una crescente accettazione di...

Per saperne di più

Arriva il giorno della sentenza: il destino di CZ è in bilico mentre la Corte degli Stati Uniti considera l'appello del Dipartimento di Giustizia

Changpeng Zhao è pronto ad affrontare oggi la sentenza in un tribunale americano a Seattle.

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Radiant Capital avvia la proposta RFP-34 e suggerisce l'onboarding di weETH nelle sue implementazioni Ethereum e Arbitrum
Notizie Tecnologia
Radiant Capital avvia la proposta RFP-34 e suggerisce l'onboarding di weETH nelle sue implementazioni Ethereum e Arbitrum
7 Maggio 2024
L'exchange di criptovalute Binance lancerà nuove coppie di trading e abiliterà i bot di trading l'8 maggio
Mercati Notizie Tecnologia
L'exchange di criptovalute Binance lancerà nuove coppie di trading e abiliterà i bot di trading l'8 maggio
7 Maggio 2024
Stacks, Moonriver Network, Hedera e Iron Fish parteciperanno al programma Interchain Amplifier di Axelar
Notizie Tecnologia
Stacks, Moonriver Network, Hedera e Iron Fish parteciperanno al programma Interchain Amplifier di Axelar
7 Maggio 2024
Tesla abbraccia Dogecoin: grande impulso alla moneta Meme che diventa un'opzione di pagamento nel negozio online di Tesla
Mercati Storie e recensioni Tecnologia
Tesla abbraccia Dogecoin: grande impulso alla moneta Meme che diventa un'opzione di pagamento nel negozio online di Tesla
7 Maggio 2024
LABORATORI DI CRITTOMERIA PTE. srl.