Stability AI Julkaisee "Stable Zero123" -mallin, joka voi luoda 3D-objekteja yhdestä kuvasta
Lyhyesti
Stability AI julkisti Stable Zero123:n, generatiivisen tekoälymallin, joka voi luoda 3D-kuvia tavallisista kuvista.
Stability AI — käynnistys kuvan luovan tekoälyjärjestelmän takana Stable Diffusion, esitteli uusimman innovaationsa - Stable Zero123. Itse koulutettu generatiivinen tekoälymalli voi luoda 3D-kuvia tavallisista kuvista laadukkaammin ja tehokkaammin.
Yhtiön mukaan äskettäin lanseerattu malli merkitsee parannusta edeltäjiinsä Zero1-to-3 ja Zero123-XL kehittyneiden koulutustietosarjojen ja -tekniikoiden ansiosta. Toisin kuin kollegansa, Stable Zero123 osoittaa syvän ymmärryksen kohteista ja tuottaa uusia ja laadukkaita näkymiä eri näkökulmista.
Yrityksen blogi sanoo, että Stable Zero123 perustuu Stable Diffusion 1.5, käyttämällä samaa määrää VRAM-muistia (Video Random Access Memory) yhden uuden näkymän luomiseen. Kuitenkin, Stability AI teki selväksi, että 3D-objektien luominen tällä mallilla vaatii enemmän aikaa ja muistia, joten optimaalista suorituskykyä varten suositellaan huomattavaa 24 Gt VRAM:ia.
Tärkeä huomautus tiedotteesta on, että malli on asetettu saataville vain ei-kaupallisiin ja tutkimustarkoituksiin, sillä yrityksen tavoitteena on edistää innovaatioita tiedeyhteisössä.
Yhtiö ilmoitti, että tutkijat ja harrastajat voivat nyt käyttää Stable Zero123:aa Halaaminen kasvot, mikä helpottaa kokeilua ja sen kykyjen tutkimista.
Uusien standardien asettaminen 3D:ssä kuvan sukupolvi
Stable Zero123:lla, Stability AI tavoitteena on edistää tietokoneella luotujen kuvien alaa tarjoamalla tutkijoille työkalun 3D-kuvien luomisen mahdollisuuksien tutkimiseen. Tätä varten se on parantanut Stabile Zero123:n harjoitustietojoukkoa. Se hyödyntää Objaversesta peräisin olevaa suodatettua harjoitustietojoukkoa keskittyen yksinomaan korkealaatuisten 3D-objektien säilyttämiseen.
Yritys renderöi nämä esineet realistisesti, ylittääkseen aiemmat menetelmät.
Sekä harjoittelun että päättelyn aikana generatiivinen tekoälymalli hyötyy korkeuden ehdollistuksesta. Antamalla mallille arvioitu kamerakulma, se tekee tietoisempia ja laadukkaampia ennusteita, mikä johtaa erinomaiseen visuaaliseen lopputulokseen.
Lisäksi sisällytetään esilaskettu aineisto (esilasketut latentit) ja parannettu tiedonlataus yhdessä kahden ensimmäisen kanssa johtivat 40-kertaiseen harjoittelutehokkuuteen verrattuna edeltäjäänsä, Zero123-XL:ään.
Kannustaa avointa tutkimusta 3D-objektien luomisessa, Stability AI on parantanut threestudio-projektin avoimen lähdekoodin tukemaan Zero123:a ja Stable Zero123:a. Yksinkertaistettu versio vakaasta 3D-prosessista on tällä hetkellä yksityisessä esikatselussa, ja se käyttää Score Distillation Sampling (SDS) -näytteitä optimoimaan hermosäteilykenttää (NeRF) käyttämällä Stable Zero123:a.
Sitä ei kuitenkaan ole tarkoitettu kaupalliseen käyttöön. Yhtiö korosti, että tämä on julkaisu yksinomaan tutkimustarkoituksiin.
Vastuun kieltäminen
Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.
Author
Kumar on kokenut teknologiatoimittaja, joka on erikoistunut AI/ML:n dynaamisiin risteyksiin, markkinointiteknologiaan ja nouseviin aloihin, kuten krypto-, lohkoketju- ja NFTs. Yli 3 vuoden kokemuksella alalta Kumar on saavuttanut todistetun ennätyksen vakuuttavien tarinoiden laatimisessa, oivaltavien haastattelujen tekemisessä ja kattavien näkemysten toimittamisessa. Kumarin asiantuntemus perustuu vaikuttavan sisällön tuottamiseen, mukaan lukien artikkeleita, raportteja ja tutkimusjulkaisuja merkittäville alan alustoille. Ainutlaatuisella taitosarjalla, jossa yhdistyvät tekninen tietämys ja tarinankerronta, Kumar on erinomainen kommunikoimaan monimutkaisia teknologisia käsitteitä eri yleisöille selkeällä ja mukaansatempaavalla tavalla.
lisää artikkeleita
Kumar on kokenut teknologiatoimittaja, joka on erikoistunut AI/ML:n dynaamisiin risteyksiin, markkinointiteknologiaan ja nouseviin aloihin, kuten krypto-, lohkoketju- ja NFTs. Yli 3 vuoden kokemuksella alalta Kumar on saavuttanut todistetun ennätyksen vakuuttavien tarinoiden laatimisessa, oivaltavien haastattelujen tekemisessä ja kattavien näkemysten toimittamisessa. Kumarin asiantuntemus perustuu vaikuttavan sisällön tuottamiseen, mukaan lukien artikkeleita, raportteja ja tutkimusjulkaisuja merkittäville alan alustoille. Ainutlaatuisella taitosarjalla, jossa yhdistyvät tekninen tietämys ja tarinankerronta, Kumar on erinomainen kommunikoimaan monimutkaisia teknologisia käsitteitä eri yleisöille selkeällä ja mukaansatempaavalla tavalla.