Informe de notícies
Setembre 30, 2022

Text-to-3D: Google ha desenvolupat una xarxa neuronal que genera models 3D a partir de descripcions de text

En breu

Text a 3D La xarxa neuronal pot generar models 3D a partir de text

DreamFusion optimitza les escenes 3D basades en el text a imatge d'Imatge

El model de difusió 2D es pot utilitzar per a la síntesi de text a imatge

Google va crear un xarxa neural capaç de crear models 3D a partir de descripcions de text. El millor és que ni tan sols calia ensenyar l'aspecte més difícil. Imagen es va utilitzar com a base per a Text-to-3D.

Text-to-3D: Google ha desenvolupat una xarxa neuronal que genera models 3D a partir de descripcions de text

De què hauríeu de saber DreamFusion?

Els models de difusió entrenats en milers de milions de parells imatge-text han donat lloc als avenços recents en la síntesi de text a imatge. L'adaptació d'aquest enfocament a la síntesi 3D necessitarà conjunts de dades a gran escala d'actius 3D etiquetats, així com arquitectures de dades 3D eficients, cap de les quals està disponible actualment. En aquest article, superem aquestes restriccions realitzant una síntesi de text a 3D amb un 2D preentrenat. difusió text a imatge model. Presentem una pèrdua basada en la destil·lació de densitat de probabilitat que permet utilitzar un model de difusió 2D com a previ per optimitzar un paramètric generador d'imatges. Utilitzant aquesta pèrdua, utilitzem el descens del gradient per optimitzar un model 3D inicialitzat aleatòriament (un camp de radiació neural o NeRF) de manera que les seves representacions 2D des d'angles aleatoris tinguin una pèrdua mínima.

El model 3D generat del text especificat es pot veure des de qualsevol angle, il·luminar-lo amb il·luminació variable i compondre's en qualsevol entorn 3D. El seu mètode no requereix dades d'entrenament en 3D ni canvis al model de difusió de la imatge, que il·lustra l'eficàcia d'utilitzar models de difusió d'imatges prèviament entrenats.

DreamFusion fa models 3D fiables amb un aspecte, profunditat i normals d'alta fidelitat basats en un subtítol. Els objectes es representen com un camp de radiació neuronal, amb un preentrenat difusió text a imatge anterior com Imagen que s'està utilitzant.

Exemples de 3D generat a partir de text

Avís: foto d'un esquirol amb una armadura medieval tocant el saxo
Avís: foto d'un esquirol amb un elegant vestit de festa assegut a una roda de ceràmica donant forma a un bol d'argila
Avís: escultura metàl·lica molt detallada d'un esquirol que porta una dessuadora amb caputxa morada que condueix una motocicleta
Avís: intricada talla de fusta d'un esquirol que porta una armadura medieval amb una katana

Ajuntant objectes per fer una escena

Com funciona?

DreamFusion optimitza una escena 3D basada en un subtítol utilitzant el model generatiu de text a imatge Imagen. Suggereix el mostreig de destil·lació de puntuació (SDS), que implica optimitzar una funció de pèrdua per produir mostres a partir d'un model de difusió. Sempre que puguem mapejar imatges de manera diferent, SDS ens permet optimitzar mostres en qualsevol espai de paràmetres, com ara un espai 3D. A defiEn aquest mapeig diferenciable, empra una parametrització d'escenes 3D semblant als camps de radiació neuronal o NeRF. Només SDS crea una aparença d'escena acceptable, però DreamFusion millora la geometria amb regularitzadors addicionals i tècniques d'optimització. Els NeRF entrenats que es produeixen són coherents, tenen excel·lents normals, geometria superficial i profunditat, i es poden tornar a revisar mitjançant un model d'ombrejat lambertià.

Llegeix articles relacionats:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

més articles
Damir Yalalov
Damir Yalalov

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

L'apetit institucional creix cap als ETF de Bitcoin enmig de la volatilitat

Les divulgacions a través de les presentacions 13F revelen inversors institucionals notables que s'estan incursionant en els ETF de Bitcoin, subratllant una acceptació creixent de...

saber Més

Arriba el dia de la sentència: el destí de CZ està en equilibri mentre el tribunal nord-americà considera la petició del DOJ

Changpeng Zhao està a punt d'enfrontar-se avui a la sentència en un tribunal dels Estats Units a Seattle.

saber Més
Uneix-te a la nostra comunitat tecnològica innovadora
Més...
Llegeix més
Injective uneix forces amb AltLayer per aportar seguretat de restauració a inEVM
Negocis Informe de notícies Tecnologia
Injective uneix forces amb AltLayer per aportar seguretat de restauració a inEVM
Pot 3, 2024
Masa s'uneix amb Teller per presentar el grup de préstecs MASA, que permet l'endeutament de l'USDC a la base
mercats Informe de notícies Tecnologia
Masa s'uneix amb Teller per presentar el grup de préstecs MASA, que permet l'endeutament de l'USDC a la base
Pot 3, 2024
Velodrome llança la versió beta de Superchain en les properes setmanes i s'expandeix a les cadenes de blocs de la capa 2 de la pila OP
mercats Informe de notícies Tecnologia
Velodrome llança la versió beta de Superchain en les properes setmanes i s'expandeix a les cadenes de blocs de la capa 2 de la pila OP
Pot 3, 2024
CARV anuncia associació amb Aethir per descentralitzar la seva capa de dades i distribuir recompenses
Negocis Informe de notícies Tecnologia
CARV anuncia associació amb Aethir per descentralitzar la seva capa de dades i distribuir recompenses
Pot 3, 2024
CRYPTOMERIA LABS PTE. LTD.