Nyheds rapport Teknologier
Januar 18, 2023

Microsoft har udgivet en diffusionsmodel, der kan bygge en 3D-avatar ud fra et enkelt foto af en person

Kort sagt

Et enkelt 2D-billede af en persons ansigt kan bruges til at generere en 3D-avatar ved hjælp af 3D Avatar Diffusion machine learning-teknikken.

Det kan bruges til at give et realistisk 3D-billede af personen til spil eller anden brug, eller til at give en virtual reality (VR) eller augmented reality (AR) oplevelse.

3D Avatar Diffusion er en maskinlæringsalgoritme, der kan tage et enkelt 2D-billede af et menneskeligt ansigt og skabe en tredimensionel (3D) avatar. Avataren kan derefter bruges til at skabe en virtual reality (VR) eller augmented reality (AR) oplevelse eller til blot at give et realistisk 3D-billede af personen til spil eller andre formål.

Diffusionsmodellen var udviklet af et team af forskere ved Microsoft Research og er beskrevet i et papir offentliggjort i tidsskriftet arXiv.

Microsoft har udgivet en diffusionsmodel, der kan bygge en 3D-avatar ud fra et enkelt foto af en person

3D Avatar Diffusion er baseret på en type maskinlæringsalgoritme kaldet en diffusionsmodel. Diffusionsmodeller er generative modeller, hvilket betyder, at de kan generere nye data, der ligner træningsdataene. Diffusionsmodeller har været brugt før til at generere 3D-billeder fra 2D-billeder, men ADM er den første diffusionsmodel, der kan generere en realistisk 3D-avatar fra et enkelt 2D-billede.

For at træne modellen brugte forskerne et datasæt med over 200,000 3D-ansigtsmodeller. Datasættet omfattede en bred vifte af ansigter med forskellige hudtoner, frisurer og ansigtstræk. ADM var derefter i stand til at lære forholdet mellem 2D-billedet og 3D-ansigtsmodellen og generere en realistisk 3D-avatar fra et enkelt 2D-billede.

Modellen kan også bruges til at generere en avatar ud fra et billede, der er taget fra en anden vinkel

Til den personlige 3D-avatar tilbyder Rodin-modellen tekststyret manipulation. Naturlig sprogredigering er en intuitiv måde at ændre mange forskellige 3D-avatarfunktioner på.

Denne undersøgelse foreslår en 3D generativ model, der automatisk skaber 3D digitale avatarer, der er repræsenteret som neurale udstrålingsfelter ved hjælp af diffusionsmodeller. På grund af de uoverkommelige hukommelses- og behandlingskrav, der er forbundet med 3D, er det et stort problem at skabe de rige funktioner, der er nødvendige for avatarer af høj kvalitet. Udviklere foreslår, at udrulningsdiffusionsnetværket (Rodin) løser dette problem.

Med hensyn til køn, alder, race, udtryk, ansigtstilbehør osv. udviser modellen en enestående generationsdiversitet.,

Dette netværk udruller adskillige 2D-funktionskort af et neuralt udstrålingsfelt i et enkelt 2D-funktionsplan, hvor modellen derefter udfører 3D-bevidst diffusion. Rodin-modellen bruger 3D-bevidst foldning, som tager sig af projicerede funktioner i 2D-egenskabsplanet i overensstemmelse med deres oprindelige forhold i 3D, for at give den meget tiltrængte beregningseffektivitet og samtidig bevare integriteten af ​​diffusion i 3D.

Læs mere om AI:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Institutionel appetit vokser mod Bitcoin ETF'er midt i volatilitet

Afsløringer gennem 13F-arkivering afslører bemærkelsesværdige institutionelle investorer, der dytter i Bitcoin ETF'er, hvilket understreger en voksende accept af ...

Vide mere

Straffeudmålingsdagen ankommer: CZ's skæbne hænger i balance, da amerikansk domstol overvejer DOJ's anbringende

Changpeng Zhao står klar til at blive dømt ved en amerikansk domstol i Seattle i dag.

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
Zeta Markets indleder fællesskab Airdrop, Tildeler 1 % af Z-tokenforsyningen til Solana-samfund
Markeder Nyheds rapport Teknologier
Zeta Markets indleder fællesskab Airdrop, Tildeler 1 % af Z-tokenforsyningen til Solana-samfund
Maj 8, 2024
KfW's Blockchain-baserede digitale obligationer: Et spring mod et mere gennemsigtigt og effektivt finansielt økosystem
Forretning Software Historier og anmeldelser Teknologier
KfW's Blockchain-baserede digitale obligationer: Et spring mod et mere gennemsigtigt og effektivt finansielt økosystem
Maj 8, 2024
Sydkoreas reviderede donationslov: Er det et skridt frem eller tilbage for kryptofilantropi?
Crypto Wiki Fordøje Forretning Markeder Teknologier
Sydkoreas reviderede donationslov: Er det et skridt frem eller tilbage for kryptofilantropi?
Maj 8, 2024
Generativ kunstig intelligens i 2024: Nye tendenser, gennembrud og fremtidsudsigter
AI Wiki Software Historier og anmeldelser Teknologier
Generativ kunstig intelligens i 2024: Nye tendenser, gennembrud og fremtidsudsigter
Maj 8, 2024