뉴스 보도
2022 년 9 월 30 일

Text-to-3D: Google은 텍스트 설명에서 3D 모델을 생성하는 신경망을 개발했습니다.

요컨대

텍스트를 3D로 신경망은 텍스트에서 3D 모델을 생성할 수 있습니다.

DreamFusion은 Imagen 텍스트 투 이미지를 기반으로 3D 장면을 최적화합니다.

2D 확산 모델은 텍스트-이미지 합성에 사용할 수 있습니다.

구글은 신경망 텍스트 설명에서 3D 모델을 생성할 수 있습니다. 가장 좋은 점은 가장 어려운 부분은 가르칠 필요조차 없다는 것입니다. Imagen은 Text-to-3D의 기반으로 사용되었습니다.

Text-to-3D: Google은 텍스트 설명에서 3D 모델을 생성하는 신경망을 개발했습니다.

무엇에 대해 알아야 합니까? 드림퓨전?

수십억 개의 이미지-텍스트 쌍에 대해 훈련된 확산 모델은 텍스트-이미지 합성의 최근 발전으로 이어졌습니다. 3D 합성에 이 접근 방식을 적용하려면 현재 사용할 수 없는 효율적인 노이즈 제거 3D 데이터 아키텍처뿐만 아니라 레이블이 지정된 3D 자산의 대규모 데이터 세트가 필요합니다. 본 논문에서는 미리 훈련된 3D로 text-to-2D 합성을 수행하여 이러한 제한을 극복합니다. 텍스트에서 이미지로의 확산 모델. 우리는 2D 확산 모델이 파라메트릭 최적화를 위한 사전 모델로 사용될 수 있도록 하는 확률 밀도 증류에 기반한 손실을 제시합니다. 그림 생성기. 이 손실을 사용하여 우리는 무작위로 초기화된 3D 모델(Neural Radiance Field 또는 NeRF)을 최적화하기 위해 경사하강법을 사용하여 무작위 각도의 2D 렌더링이 최소한의 손실을 갖도록 합니다.

지정된 텍스트의 생성된 3D 모델은 모든 각도에서 볼 수 있으며 가변 조명으로 조명되고 모든 3D 환경으로 합성됩니다. 이 방법에는 3D 교육 데이터가 필요하지 않으며 이미지 확산 모델, 이전과 같이 사전 훈련된 이미지 확산 모델을 사용하는 효능을 설명합니다.

DreamFusion은 캡션을 기반으로 충실도가 높은 모양, 깊이 및 법선으로 재조명 가능한 3D 모델을 만듭니다. 개체는 미리 훈련된 텍스트에서 이미지로의 확산 Imagen과 같이 이전에 사용되었습니다.

텍스트에서 생성된 3D의 예

프롬프트: 색소폰을 연주하는 중세 갑옷을 입은 다람쥐 사진
프롬프트: 점토 그릇을 만들고 있는 도자기 물레 앞에 앉아 우아한 가운을 입은 다람쥐의 사진
프롬프트: 오토바이를 타는 보라색 후드티를 입은 다람쥐의 매우 상세한 금속 조각
프롬프트: 카타나를 휘두르는 중세 갑옷을 입은 다람쥐의 복잡한 나무 조각

사물을 모아서 장면 만들기

어떻게 진행합니까?

DreamFusion은 Imagen 텍스트-이미지 생성 모델을 사용하여 캡션을 기반으로 3D 장면을 최적화합니다. 확산 모델에서 샘플을 생성하기 위해 손실 함수를 최적화하는 SDS(Score Distillation Sampling)를 제안합니다. 이미지에 다르게 매핑할 수 있는 한 SDS를 사용하면 3D 공간과 같은 모든 매개 변수 공간에서 샘플을 최적화할 수 있습니다. 에게 defi이 차별화 가능한 매핑에서는 Neural Radiance Fields 또는 NeRF와 유사한 3D 장면 매개변수화를 사용합니다. SDS만으로도 무난한 장면 모양을 생성하지만 DreamFusion은 추가 정규화 및 최적화 기술로 형상을 향상시킵니다. 생성되는 훈련된 NeRF는 일관되고 우수한 법선, 표면 기하학 및 깊이를 가지며 Lambertian 음영 모델을 사용하여 재조명될 수 있습니다.

관련 기사를 읽으십시오 :

책임 한계

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

솔라나 폭풍 전의 고요: 차트, 고래, 온체인 신호가 지금 말하고 있는 것

솔라나는 채택 증가, 기관적 관심, 핵심 파트너십에 힘입어 강력한 성과를 보였지만, 잠재적인 어려움에 직면해 있습니다.

현장 사진

2025년 XNUMX월 암호화폐: 주요 트렌드, 변화, 그리고 앞으로의 전망

2025년 XNUMX월, 암호화폐 분야는 핵심 인프라 강화에 집중했고, 이더리움은 Pectra를 준비했습니다.

현장 사진
자세히 보기
더보기
Eightco, Bitmine, ARK Invest, Payward 주도로 1억 2,500만 달러 규모의 기관 투자 유치, 차세대 기술 투자 가속화에 나서
근무지에서 발생 뉴스 보도 기술
Eightco, Bitmine, ARK Invest, Payward 주도로 1억 2,500만 달러 규모의 기관 투자 유치, 차세대 기술 투자 가속화에 나서
2026 년 3 월 13 일
CZ, 포브스의 순자산 주장 반박; 주요 암호화폐 업계 인사들의 실제 재산은 얼마일까?
근무지에서 발생 시장 뉴스 보도 기술
CZ, 포브스의 순자산 주장 반박; 주요 암호화폐 업계 인사들의 실제 재산은 얼마일까?
2026 년 3 월 13 일
성장에서 안정성으로: HSC 자산운용의 대담에서 시장 변화와 중국의 세계적 영향력을 살펴봅니다
해킹 시즌 의견 근무지에서 발생 생활 뉴스 보도 기술
성장에서 안정성으로: HSC 자산운용의 대담에서 시장 변화와 중국의 세계적 영향력을 살펴봅니다
2026 년 3 월 13 일
옥스퍼드 AI 연구원 사무엘 마로, 탈중앙화 AI와 블록체인에 대해 이야기하다: 통합이 가치를 더할 때도 있지만 혁신을 제한할 때도 있다
인터뷰 기술
옥스퍼드 AI 연구원 사무엘 마로, 탈중앙화 AI와 블록체인에 대해 이야기하다: 통합이 가치를 더할 때도 있지만 혁신을 제한할 때도 있다
2026 년 3 월 13 일
CRYPTOMERIA LABS PTE. LTD.