뉴스 보도
2022 년 9 월 30 일

Text-to-3D: Google은 텍스트 설명에서 3D 모델을 생성하는 신경망을 개발했습니다.

요컨대

텍스트를 3D로 신경망은 텍스트에서 3D 모델을 생성할 수 있습니다.

DreamFusion은 Imagen 텍스트 투 이미지를 기반으로 3D 장면을 최적화합니다.

2D 확산 모델은 텍스트-이미지 합성에 사용할 수 있습니다.

구글은 신경망 텍스트 설명에서 3D 모델을 생성할 수 있습니다. 가장 좋은 점은 가장 어려운 부분은 가르칠 필요조차 없다는 것입니다. Imagen은 Text-to-3D의 기반으로 사용되었습니다.

Text-to-3D: Google은 텍스트 설명에서 3D 모델을 생성하는 신경망을 개발했습니다.

무엇에 대해 알아야 합니까? 드림퓨전?

수십억 개의 이미지-텍스트 쌍에 대해 훈련된 확산 모델은 텍스트-이미지 합성의 최근 발전으로 이어졌습니다. 3D 합성에 이 접근 방식을 적용하려면 현재 사용할 수 없는 효율적인 노이즈 제거 3D 데이터 아키텍처뿐만 아니라 레이블이 지정된 3D 자산의 대규모 데이터 세트가 필요합니다. 본 논문에서는 미리 훈련된 3D로 text-to-2D 합성을 수행하여 이러한 제한을 극복합니다. 텍스트에서 이미지로의 확산 모델. 우리는 2D 확산 모델이 파라메트릭 최적화를 위한 사전 모델로 사용될 수 있도록 하는 확률 밀도 증류에 기반한 손실을 제시합니다. 그림 생성기. 이 손실을 사용하여 우리는 무작위로 초기화된 3D 모델(Neural Radiance Field 또는 NeRF)을 최적화하기 위해 경사하강법을 사용하여 무작위 각도의 2D 렌더링이 최소한의 손실을 갖도록 합니다.

지정된 텍스트의 생성된 3D 모델은 모든 각도에서 볼 수 있으며 가변 조명으로 조명되고 모든 3D 환경으로 합성됩니다. 이 방법에는 3D 교육 데이터가 필요하지 않으며 이미지 확산 모델, 이전과 같이 사전 훈련된 이미지 확산 모델을 사용하는 효능을 설명합니다.

DreamFusion은 캡션을 기반으로 충실도가 높은 모양, 깊이 및 법선으로 재조명 가능한 3D 모델을 만듭니다. 개체는 미리 훈련된 텍스트에서 이미지로의 확산 Imagen과 같이 이전에 사용되었습니다.

텍스트에서 생성된 3D의 예

프롬프트: 색소폰을 연주하는 중세 갑옷을 입은 다람쥐 사진
프롬프트: 점토 그릇을 만들고 있는 도자기 물레 앞에 앉아 우아한 가운을 입은 다람쥐의 사진
프롬프트: 오토바이를 타는 보라색 후드티를 입은 다람쥐의 매우 상세한 금속 조각
프롬프트: 카타나를 휘두르는 중세 갑옷을 입은 다람쥐의 복잡한 나무 조각

사물을 모아서 장면 만들기

어떻게 진행합니까?

DreamFusion은 Imagen 텍스트-이미지 생성 모델을 사용하여 캡션을 기반으로 3D 장면을 최적화합니다. 확산 모델에서 샘플을 생성하기 위해 손실 함수를 최적화하는 SDS(Score Distillation Sampling)를 제안합니다. 이미지에 다르게 매핑할 수 있는 한 SDS를 사용하면 3D 공간과 같은 모든 매개 변수 공간에서 샘플을 최적화할 수 있습니다. 에게 defi이 차별화 가능한 매핑에서는 Neural Radiance Fields 또는 NeRF와 유사한 3D 장면 매개변수화를 사용합니다. SDS만으로도 무난한 장면 모양을 생성하지만 DreamFusion은 추가 정규화 및 최적화 기술로 형상을 향상시킵니다. 생성되는 훈련된 NeRF는 일관되고 우수한 법선, 표면 기하학 및 깊이를 가지며 Lambertian 음영 모델을 사용하여 재조명될 수 있습니다.

관련 기사를 읽으십시오 :

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

변동성 속에서 비트코인 ​​ETF를 향한 기관의 선호도 증가

13F 서류를 통한 공개를 통해 주목할만한 기관 투자자들이 비트코인 ​​ETF에 손을 대고 있음이 드러났으며, 이는 비트코인 ​​ETF에 대한 수용이 증가하고 있음을 강조합니다.

현장 사진

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
Injective는 AltLayer와 힘을 합쳐 inEVM에 재스테이킹 보안을 도입했습니다.
근무지에서 발생 뉴스 보도 Technology
Injective는 AltLayer와 힘을 합쳐 inEVM에 재스테이킹 보안을 도입했습니다.
2024 년 5 월 3 일
Masa는 텔러와 협력하여 MASA 대출 풀을 도입하고 USDC에서 베이스 대출을 활성화합니다.
시장 뉴스 보도 Technology
Masa는 텔러와 협력하여 MASA 대출 풀을 도입하고 USDC에서 베이스 대출을 활성화합니다.
2024 년 5 월 3 일
Velodrome은 앞으로 몇 주 안에 Superchain 베타 버전을 출시하고 OP 스택 레이어 2 블록체인으로 확장합니다.
시장 뉴스 보도 Technology
Velodrome은 앞으로 몇 주 안에 Superchain 베타 버전을 출시하고 OP 스택 레이어 2 블록체인으로 확장합니다.
2024 년 5 월 3 일
CARV, 데이터 계층을 분산화하고 보상을 분배하기 위해 Aethir와의 파트너십 발표
근무지에서 발생 뉴스 보도 Technology
CARV, 데이터 계층을 분산화하고 보상을 분배하기 위해 Aethir와의 파트너십 발표
2024 년 5 월 3 일
CRYPTOMERIA LABS PTE. LTD.