Naujienų ataskaita
Rugsėjis 30, 2022

Tekstas į 3D: „Google“ sukūrė neuroninį tinklą, kuris generuoja 3D modelius iš teksto aprašymų

Trumpai

Tekstas į 3D neuroninis tinklas gali generuoti 3D modelius iš teksto

„DreamFusion“ optimizuoja 3D scenas, remdamasi „Imagen“ tekstu į vaizdą

2D difuzijos modelis gali būti naudojamas teksto į vaizdą sintezei

Google sukūrė a neuroninis tinklas galintis kurti 3D modelius iš tekstinių aprašymų. Geriausia tai, kad sunkiausio aspekto net nereikėjo mokyti. Imagen buvo naudojamas kaip tekstas į 3D pagrindas.

Tekstas į 3D: „Google“ sukūrė neuroninį tinklą, kuris generuoja 3D modelius iš teksto aprašymų

Apie ką turėtumėte žinoti DreamFusion?

Difuzijos modeliai, parengti naudojant milijardus vaizdo ir teksto porų, lėmė naujausią teksto į vaizdą sintezės pažangą. Pritaikius šį požiūrį į 3D sintezę, reikės didelio masto pažymėtų 3D išteklių duomenų rinkinių, taip pat efektyvių 3D duomenų architektūrų, kurios šiuo metu nėra prieinamos. Šiame darbe mes įveikiame šiuos apribojimus atlikdami teksto į 3D sintezę su iš anksto paruoštu 2D teksto į vaizdą sklaida modelis. Pateikiame nuostolius, pagrįstus tikimybės tankio distiliavimu, kuris leidžia naudoti 2D difuzijos modelį kaip išankstinį parametrinį optimizavimą. paveikslėlių generatorius. Naudodami šį praradimą, mes naudojame gradiento nusileidimą, kad optimizuotume atsitiktinai inicijuotą 3D modelį (Neural Radiance Field arba NeRF), kad jo 2D atvaizdavimas iš atsitiktinių kampų būtų minimalus.

Sukurtas nurodyto teksto 3D modelis gali būti peržiūrimas bet kokiu kampu, apšviestas kintamu apšvietimu ir sukomponuotas į bet kurią 3D aplinką. Jo metodui nereikia 3D mokymo duomenų ir jokių pakeitimų vaizdo sklaidos modelis, iliustruojantis iš anksto paruoštų vaizdo sklaidos modelių naudojimo efektyvumą, kaip ir anksčiau.

„DreamFusion“ sukuria nuostabius 3D modelius, kurių išvaizda, gylis ir normalūs, remiantis antrašte. Objektai vaizduojami kaip nervinio spinduliavimo laukas su iš anksto apmokytu teksto į vaizdą sklaida kaip naudojamas vaizdas.

Sukurto 3D iš teksto pavyzdžiai

Raginimas: voverės, vilkinčios viduramžių šarvų kostiumą ir grojančios saksofonu, nuotrauka
Raginimas: nuotrauka, kurioje voverė vilki elegantišką rutulinį chalatą, sėdi prie keramikos rato ir formuoja molinį dubenį
Raginimas: labai detali metalinė skulptūra, kurioje voverė vilki violetinį gobtuvą važiuojanti motociklu
Raginimas: sudėtingas medinis raižinys, vaizduojantis voverę, vilkinčią viduramžių šarvų kostiumą ir nešiojančią kataną

Objektų sujungimas, kad būtų sukurta scena

Kaip tai veikia?

„DreamFusion“ optimizuoja 3D sceną pagal antraštę, naudodama „Imagen“ teksto į vaizdą generavimo modelį. Jame siūlomas taškinis distiliavimo mėginių ėmimas (SDS), kuris apima nuostolių funkcijos optimizavimą, kad būtų gauti mėginiai iš difuzijos modelio. Kol galime skirtingai susieti vaizdus, ​​SDS leidžia optimizuoti pavyzdžius bet kurioje parametrų erdvėje, pvz., 3D erdvėje. Į defiBe šio diferencijuojamo atvaizdavimo, jis naudoja 3D scenos parametrizavimą, kuris yra panašus į neuronų spinduliavimo laukus arba NeRF. Vien SDS sukuria priimtiną scenos išvaizdą, tačiau „DreamFusion“ pagerina geometriją, naudodama papildomus reguliariuosius ir optimizavimo būdus. Pagaminti išmokyti NeRF yra nuoseklūs, turi puikius normalius parametrus, paviršiaus geometriją ir gylį, todėl juos galima pakartotinai apšviesti naudojant Lambertian šešėlio modelį.

Skaityti susijusius straipsnius:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Daugiau straipsnių
Damiras Jalalovas
Damiras Jalalovas

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Institucinis apetitas Bitcoin ETF atžvilgiu auga dėl nepastovumo

13F paraiškų atskleidimas atskleidžia žymius institucinius investuotojus, kurie naudojasi Bitcoin ETF, o tai rodo, kad vis labiau pritariama...

Žinoti daugiau

Ateina nuosprendžio paskelbimo diena: CZ likimas subalansuotas, nes JAV teismas svarsto DOJ prašymą

Changpeng Zhao šiandien laukia nuosprendžio JAV teisme Sietle.

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
Injective sujungia jėgas su AltLayer, kad padidintų inEVM saugumą
Atsakingas verslas Naujienų ataskaita Technologija
Injective sujungia jėgas su AltLayer, kad padidintų inEVM saugumą
Gali 3, 2024
„Masa“ bendradarbiauja su „Teller“, kad pristatytų MASA skolinimo fondą, leidžiantį skolintis USDC pagrindu
rinkos Naujienų ataskaita Technologija
„Masa“ bendradarbiauja su „Teller“, kad pristatytų MASA skolinimo fondą, leidžiantį skolintis USDC pagrindu
Gali 3, 2024
„Velodrome“ ateinančiomis savaitėmis pristato „Superchain“ beta versiją ir išplečiama visose „OP Stack Layer 2 Blockchains“
rinkos Naujienų ataskaita Technologija
„Velodrome“ ateinančiomis savaitėmis pristato „Superchain“ beta versiją ir išplečiama visose „OP Stack Layer 2 Blockchains“
Gali 3, 2024
CARV praneša apie partnerystę su Aethir, kad decentralizuotų savo duomenų sluoksnį ir paskirstytų atlygį
Atsakingas verslas Naujienų ataskaita Technologija
CARV praneša apie partnerystę su Aethir, kad decentralizuotų savo duomenų sluoksnį ir paskirstytų atlygį
Gali 3, 2024
CRYPTOMERIA LABS PTE. LTD.