GLIGEN: uusi jäädytetty tekstistä kuvaksi sukupolvimalli, jossa on rajauslaatikko
Lyhyesti
GLIGEN tai Grounded-Language-to-Image Generation on uusi tekniikka, joka perustuu nykyisten valmiiksi koulutettujen diffuusiomallien ominaisuuksiin ja laajentaa niiden kykyä.
Kuvatekstien ja rajoituslaatikoiden ehtotulojen avulla GLIGEN-malli luo avoimen maailman maadoitettua text2img:tä.
GLIGEN voi luoda erilaisia objekteja tietyissä paikoissa ja tyyleissä hyödyntämällä valmiiksi koulutetun text2img-mallin tietoa.
GLIGEN voi myös maadoittaa ihmisen avainpisteitä luodessaan tekstiä kuviksi.
Laajamittainen tekstistä kuvaksi diffuusiomallit ovat edenneet pitkälle. Nykyinen käytäntö on kuitenkin luottaa pelkästään tekstinsyöttöön, mikä voi rajoittaa ohjattavuutta. GLIGEN, tai Grounded-Language-to-Image Generation, on uusi tekniikka, joka rakentuu nykyisille esiopetetuille tekstistä kuvaksi diffuusiomalleille ja laajentaa niiden kykyä sallimalla niiden ehdollistamisen maadoitustuloihin.
Säilyttääkseen esikoulutetun mallin laajan konseptitietämyksen kehittäjät jäädyttävät sen kaikki painot ja pumppaavat maadoitustiedot uusiin koulutettaviin kerroksiin hallitun prosessin kautta. Kuvatekstien ja rajoituslaatikoiden ehtotulojen avulla GLIGEN-malli luo avoimen maailman maadoitettua tekstiä kuvaksi, ja maadoituskyky yleistyy tehokkaasti uusiin tilakonfiguraatioihin ja konsepteihin.
Tutustu esittely tästä.
- GLIGEN perustuu olemassa olevaan esikoulutettuun diffuusio malleja, jonka alkuperäiset painot on jäädytetty valtavan määrän esikoulutettua tietoa säilyttämiseksi.
- Jokaiseen muuntajalohkoon luodaan uusi koulutettava Gated Self-Attention -kerros imemään ylimääräistä maadoitustuloa.
- Jokaisella maadoitustunnisteella on kahden tyyppistä tietoa: semanttista tietoa maadoitetusta asiasta (koodattu teksti tai kuva) ja paikkatieto (koodattu rajoitusruutu tai avainpisteet).
Aiheeseen liittyvä artikkeli: VToonify: Reaaliaikainen tekoälymalli taiteellisten muotokuvavideoiden luomiseen |
Aiheeseen liittyvä artikkeli: Microsoft on julkaissut diffuusiomallin, joka voi rakentaa 3D-avatarin yhdestä henkilön valokuvasta |
Lue lisää tekoälystä:
Vastuun kieltäminen
Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.
Author
Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.
lisää artikkeleitaDamir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.