Raport aktualności Technologia
18 stycznia 2023 r.

Firma Microsoft wydała model rozpowszechniania, który umożliwia zbudowanie awatara 3D z pojedynczego zdjęcia osoby

W skrócie

Pojedynczy obraz 2D twarzy osoby może zostać użyty do wygenerowania awatara 3D przy użyciu techniki uczenia maszynowego 3D Avatar Diffusion.

Może być używany do zapewnienia realistycznego widoku 3D osoby do gier lub innych zastosowań lub do zapewnienia rzeczywistości wirtualnej (VR) lub rzeczywistości rozszerzonej (AR).

3D Avatar Diffusion to algorytm uczenia maszynowego, który może pobrać pojedynczy obraz 2D ludzkiej twarzy i stworzyć trójwymiarowy (3D) awatar. Awatara można następnie użyć do stworzenia wirtualnej rzeczywistości (VR) lub rozszerzonej rzeczywistości (AR) lub po prostu zapewnić realistyczny widok 3D osoby do gier lub innych celów.

Model dyfuzyjny był rozwinięty przez zespół badaczy z Microsoft Research i jest opisany w artykule opublikowanym w czasopiśmie arXiv.

Firma Microsoft wydała model rozpowszechniania, który umożliwia zbudowanie awatara 3D z pojedynczego zdjęcia osoby

3D Avatar Diffusion opiera się na algorytmie uczenia maszynowego zwanym modelem dyfuzji. Modele dyfuzyjne są modelami generatywnymi, co oznacza, że ​​mogą generować nowe dane, które są podobne do danych uczących. Modele dyfuzyjne były używane wcześniej do generowania obrazów 3D z obrazów 2D, ale ADM jest pierwszym modelem dyfuzyjnym, który może wygenerować realistyczny awatar 3D z pojedynczego obrazu 2D.

Aby wyszkolić model, naukowcy wykorzystali zestaw danych zawierający ponad 200,000 3 trójwymiarowych modeli twarzy. Zbiór danych obejmował szeroką gamę twarzy o różnych odcieniach skóry, fryzurach i rysach twarzy. ADM był wtedy w stanie poznać związek między obrazem 2D a modelem twarzy 3D i wygenerować realistyczny awatar 3D z pojedynczego obrazu 2D.

Model może być również wykorzystany do wygenerowania awatara ze zdjęcia zrobionego pod innym kątem

W przypadku spersonalizowanego awatara 3D model Rodina oferuje manipulację tekstową. Edycja języka naturalnego to intuicyjny sposób zmiany wielu różnych funkcji awatara 3D.

W tym badaniu zaproponowano generatywny model 3D, który automatycznie tworzy cyfrowe awatary 3D, które są reprezentowane jako neuronowe pola promieniowania przy użyciu modeli dyfuzji. Ze względu na wygórowane wymagania dotyczące pamięci i przetwarzania związane z grafiką 3D, tworzenie bogatych funkcji niezbędnych dla wysokiej jakości awatarów jest ogromnym problemem. Deweloperzy sugerują, że rozwinięcie sieci rozpowszechniania (Rodin) rozwiąże ten problem.

Pod względem płci, wieku, rasy, ekspresji, akcesoriów do twarzy itp., modelka wykazuje wybitną różnorodność pokoleniową.​

Ta sieć rozwija liczne mapy cech 2D neuronowego pola radiancji w jedną płaszczyznę cech 2D, gdzie model następnie wykonuje dyfuzję świadomą 3D. Model Rodina wykorzystuje konwolucję świadomą 3D, która obsługuje rzutowane elementy na płaszczyźnie charakterystycznej 2D zgodnie z ich pierwotnym związkiem w 3D, aby zapewnić bardzo potrzebną wydajność obliczeniową przy jednoczesnym zachowaniu integralności rozproszenia w 3D.

Przeczytaj więcej o sztucznej inteligencji:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Więcej artykułów
Damir Jałałow
Damir Jałałow

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Hot Stories
Dołącz do naszego newslettera.
Najnowsze wieści

Apetyt instytucjonalny na ETFy Bitcoin rośnie w obliczu zmienności

Ujawnienia zawarte w zgłoszeniach 13F ujawniają, że znaczący inwestorzy instytucjonalni parają się funduszami ETF Bitcoin, co podkreśla rosnącą akceptację…

Dowiedz się więcej

Nadchodzi dzień wyroku: los CZ wisi na włosku, gdy amerykański sąd rozpatruje skargę Departamentu Sprawiedliwości

Changpeng Zhao stanie dziś przed amerykańskim sądem w Seattle wyrokiem skazującym.

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Zeta Markets inicjuje społeczność Airdrop, przydziela 1% dostaw tokenów Z społecznościom Solana
rynki Raport aktualności Technologia
Zeta Markets inicjuje społeczność Airdrop, przydziela 1% dostaw tokenów Z społecznościom Solana
8 maja 2024 r.
Cyfrowe obligacje KfW oparte na Blockchain: krok w kierunku bardziej przejrzystego i wydajnego ekosystemu finansowego
Biznes Tworzenie Historie i recenzje Technologia
Cyfrowe obligacje KfW oparte na Blockchain: krok w kierunku bardziej przejrzystego i wydajnego ekosystemu finansowego
8 maja 2024 r.
Zmieniona ustawa o darowiznach w Korei Południowej: czy to krok do przodu czy do tyłu w dziedzinie kryptofilantropii?
krypto Wiki Digest Biznes rynki Technologia
Zmieniona ustawa o darowiznach w Korei Południowej: czy to krok do przodu czy do tyłu w dziedzinie kryptofilantropii?
8 maja 2024 r.
Generatywna sztuczna inteligencja w 2024 r.: pojawiające się trendy, przełomy i perspektywy na przyszłość
AI Wiki Tworzenie Historie i recenzje Technologia
Generatywna sztuczna inteligencja w 2024 r.: pojawiające się trendy, przełomy i perspektywy na przyszłość
8 maja 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.