Vijesti
Rujna 30, 2022

Text-to-3D: Google je razvio neuronsku mrežu koja generira 3D modele iz tekstualnih opisa

Ukratko

Tekst u 3D neuronska mreža može generirati 3D modele iz teksta

DreamFusion optimizira 3D scene na temelju Imagen teksta u sliku

2D difuzijski model može se koristiti za sintezu teksta u sliku

Google je stvorio a neuronska mreža sposoban za izradu 3D modela iz tekstualnih opisa. Najbolje od svega je to što najteži aspekt nije ni trebalo poučavati. Imagen je korišten kao temelj za Text-to-3D.

Text-to-3D: Google je razvio neuronsku mrežu koja generira 3D modele iz tekstualnih opisa

Što biste trebali znati o DreamFusion?

Difuzijski modeli uvježbani na milijardama parova slika-tekst doveli su do nedavnog napretka u sintezi teksta u sliku. Prilagodba ovog pristupa 3D sintezi zahtijevat će skupove podataka velikih razmjera označenih 3D sredstava, kao i učinkovite arhitekture 3D podataka za uklanjanje šuma, od kojih nijedna trenutno nije dostupna. U ovom radu prevladavamo ta ograničenja izvođenjem sinteze teksta u 3D s prethodno obučenim 2D difuzija teksta u sliku model. Predstavljamo gubitak na temelju destilacije gustoće vjerojatnosti koja omogućuje korištenje 2D modela difuzije kao prethodnog za optimizaciju parametarskog generator slike. Koristeći ovaj gubitak, koristimo gradijentni pad za optimizaciju nasumično inicijaliziranog 3D modela (Neural Radiance Field ili NeRF) tako da njegovi 2D prikazi iz nasumičnih kutova imaju minimalan gubitak.

Generirani 3D model navedenog teksta može se gledati iz bilo kojeg kuta, osvijetljen varijabilnom rasvjetom i ukomponirati u bilo koje 3D okruženje. Njegova metoda ne zahtijeva podatke o 3D obuci niti promjene u model difuzije slike, koji ilustrira učinkovitost korištenja prethodno obučenih modela difuzije slike.

DreamFusion izrađuje 3D modele koji se mogu ponovno osvijetliti s izgledom visoke vjernosti, dubinom i normalama na temelju naslova. Objekti su predstavljeni kao polje neuralnog zračenja, s unaprijed uvježbanim difuzija teksta u sliku prije korištenja Imagena.

Primjeri generiranih 3D iz teksta

Uputa: fotografija vjeverice u srednjovjekovnom oklopu koja svira saksofon
Uputa: fotografija vjeverice u elegantnoj balskoj haljini koja sjedi za lončarskim kotačem i oblikuje glinenu zdjelu
Uputa: vrlo detaljna metalna skulptura vjeverice koja nosi ljubičastu majicu s kapuljačom i vozi motocikl
Zahtjev: zamršene drvene rezbarije vjeverice u srednjovjekovnom oklopu s katanom

Spajanje predmeta kako bi se napravila scena

Kako radi?

DreamFusion optimizira 3D scenu na temelju naslova pomoću Imagen generativnog modela teksta u sliku. Predlaže Score Destillation Sampling (SDS), koji uključuje optimizaciju funkcije gubitaka za proizvodnju uzoraka iz difuzijskog modela. Sve dok se možemo preslikavati na različite načine, SDS nam omogućuje optimizaciju uzoraka u bilo kojem prostoru parametara, kao što je 3D prostor. Do defiU ovom diferencijabilnom mapiranju koristi se parametrizacija 3D scene koja je slična poljima neuralnog zračenja ili NeRF-ovima. Sam SDS stvara prihvatljiv izgled scene, ali DreamFusion poboljšava geometriju dodatnim regulatorima i tehnikama optimizacije. Uvježbani NeRF-ovi koji se proizvode su koherentni, imaju izvrsne normale, geometriju površine i dubinu i mogu se ponovno osvijetliti pomoću Lambertiovog modela sjenčanja.

Pročitajte povezane članke:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Više članaka
Damir Yalalov
Damir Yalalov

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Institucionalni apetit raste prema Bitcoin ETF-ovima usred volatilnosti

Objave putem 13F prijava otkrivaju značajne institucionalne ulagače koji se upuštaju u Bitcoin ETF-ove, naglašavajući sve veće prihvaćanje ...

Znati više

Stiže dan izricanja presude: CZ-ova sudbina visi na ravnoteži dok američki sud razmatra izjavu DOJ-a

Changpeng Zhao danas će se suočiti s kaznom na američkom sudu u Seattleu.

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
Injective udružuje snage s AltLayerom kako bi unio sigurnost ponovnog postavljanja na inEVM
posao Vijesti Tehnologija
Injective udružuje snage s AltLayerom kako bi unio sigurnost ponovnog postavljanja na inEVM
Neka 3, 2024
Masa se udružuje s Tellerom kako bi uveli MASA Lending Pool, omogućujući USDC posuđivanje na bazi
tržišta Vijesti Tehnologija
Masa se udružuje s Tellerom kako bi uveli MASA Lending Pool, omogućujući USDC posuđivanje na bazi
Neka 3, 2024
Velodrome lansira Superchain Beta verziju u nadolazećim tjednima i proširuje se na OP Stack Layer 2 Blockchains
tržišta Vijesti Tehnologija
Velodrome lansira Superchain Beta verziju u nadolazećim tjednima i proširuje se na OP Stack Layer 2 Blockchains
Neka 3, 2024
CARV najavljuje partnerstvo s Aethirom za decentralizaciju svog podatkovnog sloja i distribuciju nagrada
posao Vijesti Tehnologija
CARV najavljuje partnerstvo s Aethirom za decentralizaciju svog podatkovnog sloja i distribuciju nagrada
Neka 3, 2024
CRYPTOMERIA LABS PTE. LTD.