뉴스 보도 Technology
2023 년 1 월 18 일

마이크로소프트가 사람 사진 한 장으로 3D 아바타를 만들 수 있는 확산 모델을 공개했다.

요컨대

2D Avatar Diffusion 기계 학습 기술을 사용하여 사람 얼굴의 단일 3D 이미지를 사용하여 3D 아바타를 생성할 수 있습니다.

게임 또는 기타 용도로 사람의 사실적인 3D 보기를 제공하거나 가상 현실(VR) 또는 증강 현실(AR) 경험을 제공하는 데 사용할 수 있습니다.

3D Avatar Diffusion은 사람 얼굴의 단일 2D 이미지를 가져와 3차원(3D) 아바타를 생성할 수 있는 기계 학습 알고리즘입니다. 그런 다음 아바타를 사용하여 가상 현실(VR) 또는 증강 현실(AR) 경험을 만들거나 단순히 게임 또는 기타 목적으로 사람의 사실적인 XNUMXD 보기를 제공할 수 있습니다.

확산 모델은 개발 Microsoft Research의 연구원 팀에 의해 저널에 게시된 논문에 설명되어 있습니다. arXiv.

마이크로소프트가 사람 사진 한 장으로 3D 아바타를 만들 수 있는 확산 모델을 공개했다.

3D Avatar Diffusion은 확산 모델이라고 하는 일종의 기계 학습 알고리즘을 기반으로 합니다. 확산 모델은 생성 모델이므로 훈련 데이터와 유사한 새로운 데이터를 생성할 수 있습니다. 확산 모델 이전에는 3D 이미지에서 2D 이미지를 생성하는 데 사용되었지만 ADM은 단일 3D 이미지에서 사실적인 2D 아바타를 생성할 수 있는 최초의 확산 모델입니다.

모델을 훈련하기 위해 연구원들은 200,000개 이상의 3D 얼굴 모델 데이터 세트를 사용했습니다. 데이터 세트에는 다양한 피부색, 헤어스타일 및 얼굴 특징을 가진 다양한 얼굴이 포함되었습니다. 그런 다음 ADM은 2D 이미지와 3D 얼굴 모델 간의 관계를 학습하고 단일 3D 이미지에서 사실적인 2D 아바타를 생성할 수 있었습니다.

이 모델은 다른 각도에서 찍은 사진에서 아바타를 생성하는 데에도 사용할 수 있습니다.

개인화 된 3D 아바타의 경우 Rodin 모델은 텍스트 안내 조작을 제공합니다. 자연어 편집은 다양한 3D 아바타 기능을 변경할 수 있는 직관적인 방법입니다.

본 연구는 확산 모델을 이용하여 신경 복사장으로 표현되는 3차원 디지털 아바타를 자동으로 생성하는 3차원 생성 모델을 제안한다. 3D와 관련된 엄청난 메모리 및 처리 요구 사항으로 인해 고품질 아바타에 필요한 풍부한 기능을 만드는 것은 큰 문제입니다. 개발자들은 롤아웃 확산 네트워크(Rodin)가 이 문제를 해결할 것을 제안합니다.

성별, 나이, 인종, 표정, 악세서리 등에서 세대차이가 뛰어난 모델이다..

이 네트워크는 신경 방사 필드의 수많은 2D 기능 맵을 단일 2D 기능 평면으로 롤아웃한 다음 모델이 3D 인식 확산을 실행합니다. Rodin 모델은 3D의 원래 관계에 따라 2D 형상 평면에 투영된 형상에 주의를 기울이는 3D 인식 컨볼루션을 사용하여 3D에서 확산의 무결성을 유지하면서 절실히 필요한 계산 효율성을 제공합니다.

AI에 대해 자세히 알아보기:

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories

Inside Wall Street Memes(WSM): 헤드라인 공개

by 빅토리아 팔치크
2024 년 5 월 07 일
뉴스레터에 가입하세요.
최신 뉴스

변동성 속에서 비트코인 ​​ETF를 향한 기관의 선호도 증가

13F 서류를 통한 공개를 통해 주목할만한 기관 투자자들이 비트코인 ​​ETF에 손을 대고 있음이 드러났으며, 이는 비트코인 ​​ETF에 대한 수용이 증가하고 있음을 강조합니다.

현장 사진

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
LD Capital, Antalpha Ventures 및 Highblock Limited가 힘을 합쳐 128억 XNUMX만 달러 규모의 홍콩 ETF 유동성 펀드 출시
근무지에서 발생 시장 뉴스 보도
LD Capital, Antalpha Ventures 및 Highblock Limited가 힘을 합쳐 128억 XNUMX만 달러 규모의 홍콩 ETF 유동성 펀드 출시
2024 년 5 월 8 일
Inside Wall Street Memes(WSM): 헤드라인 공개
근무지에서 발생 시장 이야기와 리뷰 Technology
Inside Wall Street Memes(WSM): 헤드라인 공개
2024 년 5 월 7 일
암호화폐 고래를 발견하세요: 시장에 있는 사람은 누구인가요?
근무지에서 발생 시장 이야기와 리뷰 Technology
암호화폐 고래를 발견하세요: 시장에 있는 사람은 누구인가요?
2024 년 5 월 7 일
Orbiter Finance는 비트코인 ​​레이어 2 Zulu 네트워크와 파트너십을 맺고 Is Lwazi 테스트넷에 배포합니다.
근무지에서 발생 뉴스 보도 Technology
Orbiter Finance는 비트코인 ​​레이어 2 Zulu 네트워크와 파트너십을 맺고 Is Lwazi 테스트넷에 배포합니다. 
2024 년 5 월 7 일
CRYPTOMERIA LABS PTE. LTD.