Novinky Technika
Ledna 18, 2023

Microsoft vydal difúzní model, který dokáže sestavit 3D avatara z jediné fotografie člověka

Stručně

Jediný 2D obrázek obličeje osoby lze použít k vytvoření 3D avatara pomocí techniky strojového učení 3D Avatar Diffusion.

Může být použit k poskytnutí realistického 3D pohledu na osobu pro hraní nebo jiné použití, nebo k poskytnutí zážitku z virtuální reality (VR) nebo rozšířené reality (AR).

3D Avatar Diffusion je algoritmus strojového učení, který dokáže pořídit jeden 2D snímek lidské tváře a vytvořit trojrozměrného (3D) avatara. Avatara pak lze použít k vytvoření zážitku z virtuální reality (VR) nebo rozšířené reality (AR) nebo jednoduše poskytnout realistický 3D pohled na osobu pro hraní her nebo jiné účely.

Difúzní model byl rozvinutý od týmu výzkumníků z Microsoft Research a je popsán v článku publikovaném v časopise arXiv.

Microsoft vydal difúzní model, který dokáže sestavit 3D avatara z jediné fotografie člověka

3D Avatar Diffusion je založen na typu algoritmu strojového učení zvaného difúzní model. Difúzní modely jsou generativní modely, což znamená, že mohou generovat nová data, která jsou podobná trénovacím datům. Difúzní modely byly dříve použity ke generování 3D obrázků z 2D obrázků, ale ADM je prvním difúzním modelem, který dokáže vytvořit realistický 3D avatar z jediného 2D obrázku.

K trénování modelu výzkumníci použili datový soubor více než 200,000 3 2D modelů obličeje. Soubor dat zahrnoval širokou škálu tváří s různými odstíny pleti, účesy a rysy obličeje. ADM se pak mohl naučit vztah mezi 3D obrázkem a 3D modelem tváře a vytvořit realistický 2D avatar z jediného XNUMXD obrázku.

Model lze také použít ke generování avatara z fotografie, která byla pořízena z jiného úhlu

Pro personalizovaného 3D avatara nabízí model Rodin textem řízenou manipulaci. Úprava přirozeného jazyka je intuitivní způsob, jak změnit mnoho různých funkcí 3D avatarů.

Tato studie navrhuje 3D generativní model, který automaticky vytváří 3D digitální avatary, které jsou reprezentovány jako pole neuronového záření pomocí difúzních modelů. Vzhledem k neúměrným požadavkům na paměť a zpracování souvisejícím s 3D je vytváření bohatých funkcí nezbytných pro vysoce kvalitní avatary obrovským problémem. Vývojáři navrhují, aby tento problém řešila zavedení difúzní sítě (Rodin).

Pokud jde o pohlaví, věk, rasu, výraz, obličejové doplňky atd., model vykazuje mimořádnou generační rozmanitost.

Tato síť rozvine četné 2D mapy prvků pole neuronového záření do jediné roviny 2D prvků, kde pak model provádí 3D-aware difúzi. Model Rodin využívá 3D-aware konvoluci, která se stará o promítané prvky v rovině 2D prvků podle jejich původního vztahu ve 3D, aby poskytla tolik potřebnou výpočetní efektivitu při zachování integrity difúze ve 3D.

Přečtěte si více o AI:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Zeta Markets iniciuje komunitu Airdrop, přiděluje 1 % dodávek tokenů Z komunitám Solana
Trhy Novinky Technika
Zeta Markets iniciuje komunitu Airdrop, přiděluje 1 % dodávek tokenů Z komunitám Solana
8
Digitální dluhopisy KfW založené na blockchainu: Skok k transparentnějšímu a efektivnějšímu finančnímu ekosystému
Business Vývoj Příběhy a recenze Technika
Digitální dluhopisy KfW založené na blockchainu: Skok k transparentnějšímu a efektivnějšímu finančnímu ekosystému
8
Revidovaný zákon o dárcovství Jižní Koreje: Je to pro krypto filantropii krok vpřed nebo zpět?
Crypto Wiki Strávit Business Trhy Technika
Revidovaný zákon o dárcovství Jižní Koreje: Je to pro krypto filantropii krok vpřed nebo zpět?
8
Generativní AI v roce 2024: Nové trendy, průlomy a výhled do budoucna
AI Wiki Vývoj Příběhy a recenze Technika
Generativní AI v roce 2024: Nové trendy, průlomy a výhled do budoucna
8
CRYPTOMERIA LABS PTE. LTD.