Nyhetsrapport
September 30, 2022

Text-till-3D: Google har utvecklat ett neuralt nätverk som genererar 3D-modeller från textbeskrivningar

I korthet

Text-till-3D neurala nätverk kan generera 3D-modeller från text

DreamFusion optimerar 3D-scener baserat på Imagen text-till-bild

2D-diffusionsmodell kan användas för text-till-bild-syntes

Google skapade en neurala nätverk kan skapa 3D-modeller från textbeskrivningar. Det bästa är att den svåraste aspekten inte ens behövde läras ut. Imagen användes som grunden för Text-to-3D.

Text-till-3D: Google har utvecklat ett neuralt nätverk som genererar 3D-modeller från textbeskrivningar

Vad ska du veta om DreamFusion?

Diffusionsmodeller som tränats på miljarder bild-text-par har lett till nya framsteg inom text-till-bild-syntes. Att anpassa detta tillvägagångssätt till 3D-syntes kommer att kräva storskaliga datauppsättningar av märkta 3D-tillgångar såväl som effektiva 3D-dataarkitekturer för avböjning, som ingen av dem är tillgänglig för närvarande. I den här artikeln övervinner vi dessa begränsningar genom att utföra text-till-3D-syntes med en förtränad 2D text-till-bild spridning modell. Vi presenterar en förlust baserad på sannolikhetsdensitetsdestillation som gör att en 2D-diffusionsmodell kan användas som en förutsättning för att optimera en parametrisk bildgenerator. Med denna förlust använder vi gradientnedstigning för att optimera en slumpmässigt initierad 3D-modell (ett Neural Radiance Field eller NeRF) så att dess 2D-renderingar från slumpmässiga vinklar har en minimal förlust.

Den genererade 3D-modellen av den specificerade texten kan ses från vilken vinkel som helst, belysas med variabel belysning och sammansättas i vilken 3D-miljö som helst. Dess metod kräver inga 3D-träningsdata och inga ändringar av bildspridningsmodell, som illustrerar effektiviteten av att använda förtränade bilddiffusionsmodeller som tidigare.

DreamFusion gör pålitliga 3D-modeller med högtroget utseende, djup och normaler baserat på en bildtext. Objekt representeras som ett neuralt strålningsfält, med en förtränad text-till-bild spridning tidigare som Imagen används.

Exempel på genererad 3D från text

Uppmaning: foto av en ekorre som bär en medeltida rustning som spelar saxofon
Uppmaning: foto av en ekorre som bär en elegant balklänning som sitter vid ett keramikhjul och formar en lerskål
Uppmaning: mycket detaljerad metallskulptur av en ekorre som bär en lila luvtröja som kör motorcykel
Uppmaning: intrikat träsnideri av en ekorre som bär en medeltida rustning med en katana

Att sätta ihop föremål för att skapa en scen

Hur fungerar det?

DreamFusion optimerar en 3D-scen baserat på en bildtext med hjälp av Imagens text-till-bild-generativa modell. Det föreslår Score Destillation Sampling (SDS), vilket innebär att optimera en förlustfunktion för att producera prover från en diffusionsmodell. Så länge vi kan mappa tillbaka till bilder på olika sätt, gör SDS det möjligt för oss att optimera prover i vilket parameterutrymme som helst, till exempel ett 3D-utrymme. Till defiUtöver denna differentierbara mappning använder den en 3D-scenparameterisering som är besläktad med Neural Radiance Fields eller NeRFs. Enbart SDS skapar ett acceptabelt scenutseende, men DreamFusion förbättrar geometrin med extra regularizers och optimeringstekniker. De tränade NeRFs som produceras är koherenta, har utmärkta normaler, ytgeometri och djup och kan tändas på nytt med en Lambertian-skuggningsmodell.

Läs relaterade artiklar:

Villkor

I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.

Om författaren

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

fler artiklar
Damir Yalalov
Damir Yalalov

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

Institutionell aptit växer mot Bitcoin ETFs mitt i volatilitet

Avslöjande genom 13F-anmälningar avslöjar anmärkningsvärda institutionella investerare som sysslar med Bitcoin ETF:er, vilket understryker en växande acceptans av ...

Lär dig mer

Straffdagen anländer: CZ:s öde hänger i balans när den amerikanska domstolen överväger DOJ:s vädjande

Changpeng Zhao är redo att dömas i en amerikansk domstol i Seattle i dag.

Lär dig mer
Gå med i vår innovativa teknikgemenskap
Läs mer
Läs mer
Injective går samman med AltLayer för att ge inEVM återupptagande säkerhet
Företag Nyhetsrapport Teknologi
Injective går samman med AltLayer för att ge inEVM återupptagande säkerhet
Maj 3, 2024
Masa samarbetar med Teller för att introducera MASA Lending Pool, möjliggör USDC-lån på basen
Marknader Nyhetsrapport Teknologi
Masa samarbetar med Teller för att introducera MASA Lending Pool, möjliggör USDC-lån på basen
Maj 3, 2024
Velodrome lanserar Superchain Beta-version under de kommande veckorna och expanderar över OP Stack Layer 2 Blockchains
Marknader Nyhetsrapport Teknologi
Velodrome lanserar Superchain Beta-version under de kommande veckorna och expanderar över OP Stack Layer 2 Blockchains
Maj 3, 2024
CARV tillkännager partnerskap med Aethir för att decentralisera sitt datalager och dela ut belöningar
Företag Nyhetsrapport Teknologi
CARV tillkännager partnerskap med Aethir för att decentralisera sitt datalager och dela ut belöningar
Maj 3, 2024