Uutisraportti
Syyskuu 30, 2022

Tekstistä 3D:ksi: Google on kehittänyt hermoverkon, joka luo 3D-malleja tekstikuvauksista

Lyhyesti

Tekstistä 3D:ksi hermoverkko voi luoda 3D-malleja tekstistä

DreamFusion optimoi 3D-kohtaukset Imagenin tekstistä kuvaksi -ominaisuuden perusteella

2D diffuusiomallia voidaan käyttää tekstistä kuvaksi synteesiin

Google loi a neuroverkkomallien pystyy luomaan 3D-malleja tekstikuvauksista. Parasta on, että vaikeinta osaa ei tarvinnut edes opettaa. Imagenia käytettiin Text-to-3D:n perustana.

Tekstistä 3D:ksi: Google on kehittänyt hermoverkon, joka luo 3D-malleja tekstikuvauksista

Mitä sinun pitäisi tietää DreamFusion?

Diffuusiomallit, jotka on koulutettu miljardeille kuva-teksti-pareille, ovat johtaneet viime aikoina edistyneisiin tekstistä kuvaksi -synteesiin. Tämän lähestymistavan mukauttaminen 3D-synteesiin edellyttää suuren mittakaavan tietojoukkoja merkityistä 3D-omaisuuksista sekä tehokkaita 3D-tietoarkkitehtuureja, jotka poistavat kohinan, joista kumpaakaan ei tällä hetkellä ole saatavilla. Tässä artikkelissa ylitämme nämä rajoitukset suorittamalla tekstistä 3D-synteesiä esiopetetulla 2D:llä tekstistä kuvaksi diffuusio malli. Esitämme häviön, joka perustuu todennäköisyystiheystislaukseen, joka mahdollistaa 2D-diffuusiomallin käytön parametrisen optimoinnin ennakkoratkaisuna. kuvan generaattori. Käyttämällä tätä häviötä käytämme gradienttilaskua optimoidaksemme satunnaisesti alustetun 3D-mallin (Neural Radiance Field tai NeRF) niin, että sen 2D-renderöinneillä satunnaisista kulmista on minimaalinen häviö.

Määritetystä tekstistä luotua 3D-mallia voidaan tarkastella mistä tahansa kulmasta, valaista vaihtelevalla valaistuksella ja yhdistää mihin tahansa 3D-ympäristöön. Sen menetelmä ei vaadi 3D-harjoitusdataa eikä muutoksia kuvan diffuusiomalli, joka kuvaa esikoulutettujen kuvan diffuusiomallien käytön tehokkuutta kuten aiemmin.

DreamFusion tekee ilahduttavia 3D-malleja, joissa on korkealaatuinen ulkoasu, syvyys ja normaalit kuvatekstin perusteella. Objektit esitetään hermosäteilykenttänä, jossa on esikoulutettu tekstistä kuvaksi diffuusio ennen kuin Imagen on käytössä.

Esimerkkejä tekstistä luodusta 3D:stä

Kehotus: valokuva oravasta, jolla on keskiaikainen haarniskapuku ja joka soittaa saksofonia
Kehotus: valokuva oravasta, jolla on tyylikäs pallopaita istumassa keramiikkapyörän ääressä ja muotoilemassa savimaljaa
Kehotus: erittäin yksityiskohtainen metalliveistos oravasta, jolla on violetti huppari, ajaa moottoripyörällä
Kehotus: monimutkainen puinen kaiverrus oravasta, jolla on keskiaikainen haarniskapuku ja joka käyttää katanaa

Esineiden yhdistäminen kohtauksen luomiseksi

Miten tämä toimii?

DreamFusion optimoi 3D-näkymän kuvatekstin perusteella käyttämällä Imagenin tekstistä kuvaksi -generatiivista mallia. Se ehdottaa Score Distillation Sampling (SDS), joka sisältää häviöfunktion optimoinnin näytteiden tuottamiseksi diffuusiomallista. Niin kauan kuin voimme kartoittaa kuvia eri tavalla, SDS antaa meille mahdollisuuden optimoida näytteitä missä tahansa parametritilassa, kuten 3D-tilassa. Vastaanottaja defiTästä erotettavissa olevasta kartoituksesta se käyttää 3D-kohtauksen parametrointia, joka muistuttaa hermosäteilykenttiä tai NeRF:itä. Pelkästään SDS luo kelvollisen kohtauksen ulkonäön, mutta DreamFusion parantaa geometriaa ylimääräisillä säätäjillä ja optimointitekniikoilla. Valmistetut koulutetut NeRF:t ovat koherentteja, niillä on erinomaiset normaaliarvot, pinnan geometria ja syvyys, ja ne voidaan valaista uudelleen Lambertian varjostusmallilla.

Lue aiheeseen liittyvät artikkelit:

Vastuun kieltäminen

Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.

Author

Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa. 

lisää artikkeleita
Damir Yalalov
Damir Yalalov

Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa. 

Institutionaalinen ruokahalu kasvaa kohti Bitcoin ETF:iä volatiliteetin keskellä

13F-hakemusten kautta tehdyt ilmoitukset paljastavat merkittäviä institutionaalisia sijoittajia, jotka harrastavat Bitcoinin ETF:itä, mikä korostaa kasvavaa hyväksyntää ...

Tiedä enemmän

Tuomiopäivä saapuu: CZ:n kohtalo on tasapainossa, kun Yhdysvaltain tuomioistuin harkitsee DOJ:n vetoomusta

Changpeng Zhao odottaa tänään tuomiota Yhdysvaltain oikeudessa Seattlessa.

Tiedä enemmän
Liity innovatiiviseen teknologiayhteisöömme
Lue lisää
Lue lisää
Injective yhdistää voimansa AltLayerin kanssa tuodakseen Restakingin turvallisuuden inEVM:ään
Bisnes Uutisraportti Elektroniikka
Injective yhdistää voimansa AltLayerin kanssa tuodakseen Restakingin turvallisuuden inEVM:ään
Voi 3, 2024
Masa tekee yhteistyötä Tellerin kanssa ottaakseen käyttöön MASA-lainauspoolin, mikä mahdollistaa USDC-lainauksen pohjalta
markkinat Uutisraportti Elektroniikka
Masa tekee yhteistyötä Tellerin kanssa ottaakseen käyttöön MASA-lainauspoolin, mikä mahdollistaa USDC-lainauksen pohjalta
Voi 3, 2024
Velodrome julkaisee Superchain Beta -version tulevina viikkoina ja laajenee OP Stack Layer 2 -lohkoketjuihin
markkinat Uutisraportti Elektroniikka
Velodrome julkaisee Superchain Beta -version tulevina viikkoina ja laajenee OP Stack Layer 2 -lohkoketjuihin
Voi 3, 2024
CARV ilmoittaa yhteistyöstä Aethirin kanssa tietokerroksen hajauttamiseksi ja palkintojen jakamiseksi
Bisnes Uutisraportti Elektroniikka
CARV ilmoittaa yhteistyöstä Aethirin kanssa tietokerroksen hajauttamiseksi ja palkintojen jakamiseksi
Voi 3, 2024
CRYPTOMERIA LABS PTE. OY.