Marraskuussa 03, 2023

Tekstistä 3D:ksi tekoälymalli

Julkaistu: 03. marraskuuta 2023 klo 9 Päivitetty: 21. marraskuuta 05 klo 2023

Mikä on tekstistä 3D:ksi tekoälymalli?

Tekstistä 3D:ksi tekoälymalli on tekniikka, joka muuntaa tekstilliset kuvaukset tai ohjeet kolmiulotteisiksi (3D) visuaalisiksi esityksiksi tai malleiksi. Tämä tekoälymalli voi ottaa tekstisyötteen, joka voi kuvata esineitä, kohtauksia tai käsitteitä, ja muuntaa sen vastaavaksi 3D-malliksi. Se toimii luonnollisen kielen käsittelyn (NLP) ja tietokonegrafiikan leikkauskohdassa ja käyttää kehittyneitä algoritmeja 3D-sisällön luomiseen toimitetun tekstin perusteella.

liittyvä: Yli 10 parasta tekoälyn 3D-generaattoria vuonna 2023: tekstistä 3D:ksi, kuvasta 3D:ksi, videosta 3D:ksi

Tekstistä 3D:ksi tekoälymallin ymmärtäminen

Tekstistä 3D:ksi tekoälymallin ymmärtäminen edellyttää taustalla olevien mekanismien ymmärtämistä, kuinka se tulkitsee ja muuntaa tekstidataa 3D-muodoiksi ja -rakenteiksi. Se vaatii tietoa NLP-tekniikoista, 3D-mallinnuksesta ja tähän tehtävään käytetystä malliarkkitehtuurista. Näistä tekoälymalleista löytyy sovelluksia eri aloilla, kuten tietokoneavusteisessa suunnittelussa, virtuaalitodellisuudessa, pelaamisessa ja arkkitehtonisessa visualisoinnissa, mikä mahdollistaa saumattoman käännöksen tekstikuvausten ja konkreettisten 3D-esitysten välillä.

presto-soitin>

Tekstistä 3D:ksi maailma

Eri alustoilla käydään runsaasti keskustelua 3D-mallien luomisesta tekstikuvauksista tai jopa yksittäisistä kuvista, mikä lupaa avata mahdollisuuksia. Mutta irrotetaan kerrokset ja tutkitaan mitä pinnan alla piilee.

Ensinnäkin on olennaista tunnustaa, että 3D ei ole vain monimutkaisten avaruusalusten ja hämmentäviä simulaatioita asuttava valtakunta; se on myös arjen sovellusten käytännöllisessä maailmassa. 3D:n ytimessä on verkkojen, monimutkaisten verkkojen luominen define 3D-objektin rakenteeseen, mikä mahdollistaa lisäkäsittelyn ja vuorovaikutuksen. Tällä hetkellä olemassa olevat tutkimuspaperit ja -projektit tarjoavat menetelmiä, jotka, hieman yksinkertaistetusti sanottuna, sisältävät tekstin tai visuaalisen syötteen oton, useiden kuvien luomisen eri näkökulmista ja sitten fotogrammetrian, laskennallisen velhon ja olemassa olevien tekniikoiden yhdistämisen 3D:n rekonstruoimiseksi. objekti syöttötiedoista.

Vaikka nämä lähestymistavat ovat edistyneet merkittävästi tekstuurin laadun ja tarkkuuden parantamisessa, jatkuva haaste on edelleen olemassa. Kysymys jää, miksi tarvitsemme näitä 3D-malleja? Vaikka he löytävätkin käytännöllisiä sovelluksia, kuten pyöriviä tuotekuvia verkkokauppoja varten, 3D-tekstuurin ja yksityiskohtien koko potentiaali jää usein vajaakäyttöiseksi, mikä johtaa suureen joukkoon TikTok-videoita ja meemejä.

Kuinka tekstistä 3D:ksi tekoälymallit toimivat?

Tekstistä 3D:ksi tekoälymallit ovat saaneet huomiota niiden mahdollisuudesta kääntää tekstikuvaukset kolmiulotteisiksi (3D) esityksiksi. Mutta miten tämä prosessi toimii ja mitä haasteita on edessä?

Prosessi voidaan jakaa kolmeen päävaiheeseen. Ensin AI-malli opetetaan tunnistamaan tietyn luokan tai tyypin 3D-objekti tietyn tietojoukon perusteella. Se analysoi tietojoukon ja sen ominaisuuksia define tähän luokkaan, jolloin se ymmärtää, kuinka kyseisen luokan objektit rakentuvat. Tämä vaihe luo perustan tekoälyn tulevalle 3D-sukupolvelle.

Toisessa vaiheessa käytetään olemassa olevia 3D-malleja viitteinä. Nämä mallit toimivat mallina tekoälylle, jolloin se voi luoda uusia 3D-objekteja, joilla on samanlaiset attribuutit ja rakenteet. Tämä viitepohjainen lähestymistapa virtaviivaistaa luontiprosessia ja auttaa säilyttämään tulosten johdonmukaisuuden.

Kolmas vaihe on hieman erikoistuneempi ja koskee ensisijaisesti luokkia, kuten ihmisen avatarit. Tässä tekoäly keskittyy tiettyihin 3D-mallien luokkiin, kuten erityyppisiin päihin. Luomalla huomattavan tietojoukon 3D-päitä ja kouluttamalla tekoälyä siihen, kehittäjät voivat luoda realistisia 3D-päitä tehokkaasti. Vaikka tämä lähestymistapa tuottaa korkealaatuisia verkkoja, se rajoittuu kapeaan objektiluokkaan.

On tärkeää huomata, että tämä tekniikka ei tuota lopullista, kiillotettua tulosta, kuten staattista kuvaa tai videota. Sen sijaan se luo välivaiheen 3D-resurssin, jota voidaan jalostaa edelleen jälkituotannossa tai käyttää tuotantoprosessissa. Tämä monipuolisuus tekee siitä arvokkaan työkalun erilaisiin sovelluksiin aina 3D-resurssien luomisesta videopeleihin sisällöntuotannon virtaviivaistamiseen.

Tekstistä 3D:ksi tekoälymallien lupauksista huolimatta haasteita on vielä voitettavana. Yksi suurimmista esteistä on tarve rajata esineluokkia, joita tekoäly voi tuottaa tehokkaasti. Ilman tätä keskittymistä tekoälyn on haastavaa tuottaa merkityksellisiä tuloksia.

Lisäksi saatavilla on runsaasti 3D-tietosarjoja, mutta kaikki eivät sovellu jälkituotannon käyttöön. Monet ovat liian meluisia ja raskaita käytännön sovelluksiin. Tämä ongelma on saanut etsimään korkealaatuisia tietojoukkoja, jotka voivat tukea parempien tekoälymallien kehittämistä.

Lisäksi luomalla Text-to-3D-malleja, jotka tuottaa omaisuutta tiettyihin tehtäviin tai ohjelmistoon sopiva on monimutkainen prosessi. Se vaatii usein erityistä lähestymistapaa, koska "parametrit" tai tekniset tiedot vaihtelevat huomattavasti eri sovellusten välillä.

Viime aikoina Luma AI on julkistanut uusimman luomuksensa, Genie – vallankumouksellinen hermoverkko, joka on suunniteltu valloittamaan 3D-mallinnusmaailma. Genie, Luma Ain aivotuote, on tehnyt merkittävän sisäänkäynnin AI-alueelle, ja sen ominaisuudet saavat sinut ihastumaan. Tämä Luma AI:n esittelemä innovatiivinen tekniikka voi vaivattomasti luoda monimutkaisia 3D-malleja muutamassa sekunnissa. tekstikehote. Genien toiminnan nopeus ja tehokkuus eivät ole muuta kuin vaikuttavaa. Tämä uraauurtava kehitys merkitsee merkittävää harppausta eteenpäin tekoälyn luoman 3D-mallinnuksen maailmassa. Toisin kuin monet muut palvelut, Genie ei ole vain hämmästyttävän nopea, vaan myös täysin ilmainen. Käyttäjät voivat luoda saumattomasti 3D-malleja ilman kustannuksia, jolloin ne ovat kaikkien saatavilla. Se on pelin muuttaja, ja mahdollisuudet ovat rajattomat.

Tekstistä 3D:ksi -kehityksen alalla ei ole harvinaista kohdata joitain vallitsevia väärinkäsityksiä. Monille kehittäjille 3D-käsite voi tuntua yhtä vaikealta kuin pelkkä pilvi pisteistä. Kasvot, reunat, kärjet, UV, Tris/Quads ja muut peruselementit jäävät joskus huomiotta, mikä jättää ymmärrykseen aukon. Se on samankaltaista, että kuvaa pidettäisiin pelkkänä pikselien ruudukona, ottamatta huomioon monimutkaisempia näkökohtia, kuten alfa, Z-kanava ja kompositio. Dall-E 3, merkittävä hahmo tällä alalla, on tietoinen läpinäkyvyydestä ja alfasta, mutta myöntää nöyrästi, että alfa-kanava on edelleen hieman arvoituksellinen. Lopputulos? Koominen sekoitus Photoshop-tyylistä ohjailua yritettäessä poista taustat. Perehdymme näihin väärinkäsityksiin valottaaksemme tekstistä 3D:ksi -kehityksen ydinperustaa.

Uusimmat uutiset tekstistä 3D:ksi tekoälymallista

Google on esitellyt TextMesh, uusi tekstistä 3D:ksi -menetelmä, joka parantaa Stable Diffusion-pohjainen tekstistä 3D-malliksi sukupolvi. Tämä menetelmä luo useita kulmia 2D-syötteestä ja käyttää NeRF (Neural Radiance Fields) -lähestymistapaa 3D-verkon luomiseen. TextMesh tarjoaa käyttäjäystävällisen tulosteen, realistiset 3D-verkot ja välttää korkeat kylläisyysvaikutukset. SDF-kehys parantaa tekstuuria, parantaa selkeyttä ja välttää ylikyllästymistä.
Nvidia on käynnistynyt Magic3D, tekstistä 3D-sisällöksi luomisohjelmisto, joka muuntaa tekstikuvaukset digitaalisiksi 3D-malleiksi. Ohjelmisto käyttää hermoverkkoa, joka on koulutettu suurelle 3D-mallien tietojoukolle, ja se voi luoda 3D-malleja yhdestä 2D-kuvasta tai 2D-kuvien sarjasta. Se tarjoaa käyttäjille uusia tapoja hallita 3D-synteesiä ja voi tuottaa korkealaatuisia 3D-verkkomalleja kaksi kertaa nopeammin kuin DreamFusion.
Google on kehittänyt hermoverkon nimeltä DreamFusion, joka voi luoda 3D-malleja tekstikuvauksista käyttämällä esikoulutettua 2D-teksti-kuva-hajautusmallia. Tämä menetelmä voittaa suuren mittakaavan tietojoukkojen ja tehokkaiden kohinaa poistavien 3D-tietoarkkitehtuurien rajoitukset. DreamFusion käyttää gradienttilaskua optimoidakseen satunnaisesti alustetun 3D-mallin, mikä johtaa valaistuihin 3D-malleihin, joissa on korkealaatuinen ulkonäkö, syvyys ja normaalit. Järjestelmä käyttää Score Distillation Sampling (SDS) -näytteitä optimoimaan näytteet missä tahansa parametritilassa, kuten 3D-tilassa.

Mitä ajattelet Stability AIuusi vakaa 3D-teksti-3D- ja kuva-3D-malli? pic.twitter.com/PITVzQ0xtM
- Tsarathustra (@tsarnick) Marraskuussa 1, 2023

Generatiivinen AI-teksti 3D-malliin + VR/AR + Verkotettu virtuaalinen 3D-tila verkkoselaimessa. Koodi ja online-demo osoitteessa https://t.co/NrX2LlHLsZ #kolme #GenAI #webxr #webgl pic.twitter.com/cY1m3gM2XY
— takahiro (John Smith) (@superhoge) Marraskuussa 3, 2023

Voimmeko luoda 3D-näkymän yhdestä 360 asteen kuvasta? Esittelemme PERFin tämän ongelman ratkaisemiseksi.

Sovellukset: 1) Panorama-to-3D; 2) tekstistä 3D:ksi; 3) Intruct 3D-tyyli.

Paperi: https://t.co/OSnaV3w5ey
Projektisivu: https://t.co/f2z8XzBW1f
Koodi: https://t.co/d4kV4qbp9m pic.twitter.com/TPPRP7VHlR
- Guangcong Wang (@GuangcongW) Lokakuu 26, 2023

Melko houkutteleva teksti 3D:ksi. Kysymys oli "moderni violetti sohva". Luodaan 14 sekunnissa (3 muun kanssa) ja GLB tuo Blenderiin vielä 5 sekunnissa.

Kokeile liittymällä Discordiin: https://t.co/z0ZwTIz4AS https://t.co/wCE7R5TiAF pic.twitter.com/tiKxzind71
- Andrew Price (@andrewpprice) Marraskuussa 2, 2023

«Takaisin sanastohakemistoon

Vastuun kieltäminen

Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.

Author

Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.

lisää artikkeleita

Damir Yalalov

Tekstistä 3D:ksi tekoälymalli

Mikä on tekstistä 3D:ksi tekoälymalli?

Tekstistä 3D:ksi tekoälymallin ymmärtäminen

Tekstistä 3D:ksi maailma

Kuinka tekstistä 3D:ksi tekoälymallit toimivat?

Uusimmat uutiset tekstistä 3D:ksi tekoälymallista

Vastuun kieltäminen

Author

Inside Wall Street Memes (WSM): Otsikoiden paljastaminen

Tutustu Crypto Whales: Kuka on kuka markkinoilla

Orbiter Finance tekee yhteistyötä Bitcoin Layer 2 Zulu -verkon kanssa ja ottaa käyttöön Lwazi Testnetissä

Crypto Exchange Bybit integroi Ethena Labsin USDe:n vakuusomaisuutena, mahdollistaa BTC-USDe- ja ETH-USDe-kauppaparit

Orbiter Finance tekee yhteistyötä Bitcoin Layer 2 Zulu -verkon kanssa ja ottaa käyttöön Lwazi Testnetissä

Crypto Exchange Bybit integroi Ethena Labsin USDe:n vakuusomaisuutena, mahdollistaa BTC-USDe- ja ETH-USDe-kauppaparit

Bitget Wallet esittelee GetDropin Airdrop Alusta ja käynnistää ensimmäisen Meme Coin -tapahtuman, jossa on 130,000 XNUMX dollarin palkintopotti

Meson Network mahdollistaa salauskaivostyöntekijöiden hankkimisen tokeneita kaivostoiminnan kautta. Airdrops Ja takaisinosto-ohjelmat ovat tulossa

Institutionaalinen ruokahalu kasvaa kohti Bitcoin ETF:iä volatiliteetin keskellä

Tuomiopäivä saapuu: CZ:n kohtalo on tasapainossa, kun Yhdysvaltain tuomioistuin harkitsee DOJ:n vetoomusta

Tekstistä 3D:ksi tekoälymalli

Mikä on tekstistä 3D:ksi tekoälymalli?

Tekstistä 3D:ksi tekoälymallin ymmärtäminen

Tekstistä 3D:ksi maailma

Kuinka tekstistä 3D:ksi tekoälymallit toimivat?

Uusimmat uutiset tekstistä 3D:ksi tekoälymallista

Uusimmat sosiaaliset viestit tekstistä 3D:ksi tekoälymalliin

Vastuun kieltäminen

Author