Nieuwsverslag Technologie
18 januari 2023

Microsoft heeft een diffusiemodel uitgebracht dat een 3D-avatar kan bouwen op basis van een enkele foto van een persoon

In het kort

Een enkele 2D-afbeelding van het gezicht van een persoon kan worden gebruikt om een ​​3D-avatar te genereren met behulp van de machine learning-techniek 3D Avatar Diffusion.

Het kan worden gebruikt om een ​​realistische 3D-weergave van de persoon te bieden voor gaming of ander gebruik, of om een ​​virtual reality- (VR) of augmented reality-ervaring (AR) te bieden.

De 3D Avatar Diffusion is een machine learning-algoritme dat een enkele 2D-afbeelding van een menselijk gezicht kan maken en een driedimensionale (3D) avatar kan maken. De avatar kan vervolgens worden gebruikt om een ​​virtual reality (VR) of augmented reality (AR) ervaring te creëren of om gewoon een realistische 3D-weergave van de persoon te bieden voor gaming of andere doeleinden.

Het diffusiemodel was ontwikkelde door een team van onderzoekers van Microsoft Research en wordt beschreven in een artikel dat in het tijdschrift is gepubliceerd arXiv.

Microsoft heeft een diffusiemodel uitgebracht dat een 3D-avatar kan bouwen op basis van een enkele foto van een persoon

De 3D Avatar Diffusion is gebaseerd op een type machine-learning algoritme dat een diffusiemodel wordt genoemd. Diffusiemodellen zijn generatieve modellen, wat betekent dat ze nieuwe gegevens kunnen genereren die vergelijkbaar zijn met de trainingsgegevens. Verspreidingsmodellen zijn eerder gebruikt om 3D-afbeeldingen te genereren uit 2D-afbeeldingen, maar de ADM is het eerste diffusiemodel dat een realistische 3D-avatar kan genereren uit een enkele 2D-afbeelding.

Om het model te trainen, gebruikten de onderzoekers een dataset van meer dan 200,000 3D-gezichtsmodellen. De dataset omvatte een grote verscheidenheid aan gezichten met verschillende huidtinten, kapsels en gelaatstrekken. De ADM kon vervolgens de relatie leren tussen het 2D-beeld en het 3D-gezichtsmodel en een realistische 3D-avatar genereren uit een enkel 2D-beeld.

Het model kan ook worden gebruikt om een ​​avatar te genereren van een foto die vanuit een andere hoek is genomen

Voor de gepersonaliseerde 3D-avatar biedt het Rodin-model tekstgestuurde manipulatie. Natuurlijke taalbewerking is een intuïtieve manier om veel verschillende 3D-avatarfuncties te wijzigen.

Deze studie stelt een generatief 3D-model voor dat automatisch 3D digitale avatars creëert die worden weergegeven als neurale stralingsvelden met behulp van diffusiemodellen. Vanwege de onbetaalbare geheugen- en verwerkingsvereisten die aan 3D zijn verbonden, is het creëren van de rijke functies die nodig zijn voor avatars van hoge kwaliteit een enorm probleem. Ontwikkelaars suggereren dat het roll-out diffusienetwerk (Rodin) dit probleem aanpakt.

In termen van geslacht, leeftijd, ras, uitdrukking, gezichtsaccessoires, enz. vertoont het model een uitstekende generatiediversiteit.​

Dit netwerk rolt talloze 2D-kenmerkkaarten van een neuraal stralingsveld uit in een enkel 2D-kenmerkvlak, waar het model vervolgens 3D-bewuste diffusie uitvoert. Het Rodin-model maakt gebruik van 3D-bewuste convolutie, die zorgt voor geprojecteerde kenmerken in het 2D-kenmerkenvlak volgens hun oorspronkelijke relatie in 3D, om de broodnodige rekenefficiëntie te bieden met behoud van de integriteit van diffusie in 3D.

Lees meer over AI:

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Meer artikelen
Damir Jalalov
Damir Jalalov

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

De institutionele belangstelling groeit richting Bitcoin ETF’s te midden van volatiliteit

Uit openbaarmakingen via 13F-registraties blijkt dat opmerkelijke institutionele beleggers zich bezighouden met Bitcoin ETF's, wat een groeiende acceptatie onderstreept van ...

Meer weten

De dag van de veroordeling breekt aan: het lot van CZ hangt in evenwicht terwijl de Amerikaanse rechtbank het pleidooi van DOJ in overweging neemt

Changpeng Zhao staat vandaag op het punt te worden veroordeeld door een Amerikaanse rechtbank in Seattle.

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Zeta Markets initieert gemeenschap Airdrop, wijst 1% van het Z-tokenaanbod toe aan Solana-gemeenschappen
Markten Nieuwsverslag Technologie
Zeta Markets initieert gemeenschap Airdrop, wijst 1% van het Z-tokenaanbod toe aan Solana-gemeenschappen
8 mei 2024
KfW's op blockchain gebaseerde digitale obligaties: een sprong naar een transparanter en efficiënter financieel ecosysteem
Business Software Verhalen en recensies Technologie
KfW's op blockchain gebaseerde digitale obligaties: een sprong naar een transparanter en efficiënter financieel ecosysteem
8 mei 2024
De herziene donatiewet van Zuid-Korea: is het een stap voorwaarts of achterwaarts voor crypto-filantropie?
crypto Wiki Verteren Business Markten Technologie
De herziene donatiewet van Zuid-Korea: is het een stap voorwaarts of achterwaarts voor crypto-filantropie?
8 mei 2024
Generatieve AI in 2024: opkomende trends, doorbraken en toekomstperspectieven
AI Wiki Software Verhalen en recensies Technologie
Generatieve AI in 2024: opkomende trends, doorbraken en toekomstperspectieven
8 mei 2024