Microsoft vydal difúzní model, který dokáže sestavit 3D avatara z jediné fotografie člověka
Stručně
Jediný 2D obrázek obličeje osoby lze použít k vytvoření 3D avatara pomocí techniky strojového učení 3D Avatar Diffusion.
Může být použit k poskytnutí realistického 3D pohledu na osobu pro hraní nebo jiné použití, nebo k poskytnutí zážitku z virtuální reality (VR) nebo rozšířené reality (AR).
3D Avatar Diffusion je algoritmus strojového učení, který dokáže pořídit jeden 2D snímek lidské tváře a vytvořit trojrozměrného (3D) avatara. Avatara pak lze použít k vytvoření zážitku z virtuální reality (VR) nebo rozšířené reality (AR) nebo jednoduše poskytnout realistický 3D pohled na osobu pro hraní her nebo jiné účely.
Difúzní model byl rozvinutý od týmu výzkumníků z Microsoft Research a je popsán v článku publikovaném v časopise arXiv.
3D Avatar Diffusion je založen na typu algoritmu strojového učení zvaného difúzní model. Difúzní modely jsou generativní modely, což znamená, že mohou generovat nová data, která jsou podobná trénovacím datům. Difúzní modely byly dříve použity ke generování 3D obrázků z 2D obrázků, ale ADM je prvním difúzním modelem, který dokáže vytvořit realistický 3D avatar z jediného 2D obrázku.
K trénování modelu výzkumníci použili datový soubor více než 200,000 3 2D modelů obličeje. Soubor dat zahrnoval širokou škálu tváří s různými odstíny pleti, účesy a rysy obličeje. ADM se pak mohl naučit vztah mezi 3D obrázkem a 3D modelem tváře a vytvořit realistický 2D avatar z jediného XNUMXD obrázku.
Model lze také použít ke generování avatara z fotografie, která byla pořízena z jiného úhlu
Tato studie navrhuje 3D generativní model, který automaticky vytváří 3D digitální avatary, které jsou reprezentovány jako pole neuronového záření pomocí difúzních modelů. Vzhledem k neúměrným požadavkům na paměť a zpracování souvisejícím s 3D je vytváření bohatých funkcí nezbytných pro vysoce kvalitní avatary obrovským problémem. Vývojáři navrhují, aby tento problém řešila zavedení difúzní sítě (Rodin).
Tato síť rozvine četné 2D mapy prvků pole neuronového záření do jediné roviny 2D prvků, kde pak model provádí 3D-aware difúzi. Model Rodin využívá 3D-aware konvoluci, která se stará o promítané prvky v rovině 2D prvků podle jejich původního vztahu ve 3D, aby poskytla tolik potřebnou výpočetní efektivitu při zachování integrity difúze ve 3D.
Přečtěte si více o AI:
Odmítnutí odpovědnosti
V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.
O autorovi
Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu.
Další článkyDamir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu.