Stability AI Julkaisee uuden mallin nimeltä SDXL Beta
Lyhyesti
Stability AI on julkaissut uuden mallin nimeltä SDXL Beta (Stable Diffusion XL Beta). Se on suurempi malli, jossa on enemmän parametreja ja joitain tuntemattomia parannuksia. Se on saatavilla DreamStudiosta, Stability AIon virallinen kuvageneraattori, ja se käyttää edistyneitä algoritmeja ja syväoppimistekniikoita upeiden visuaalien luomiseen.
Stability AI on julkistanut esikatselun uudesta mallista nimeltä SDXL Beta, lyhenne sanoista Stable Diffusion XL Beta. Toistaiseksi yritys ei ole jakanut paljon tietoa mallista, mutta se on testattavissa kaikille, jotka haluavat tehdä niin. Mitä uutta tässä SDXL-mallissa on? stable diffusion? Mitkä ovat sen edut ja haitat? Tutkitaanpa.
Lue lisää: Midjourney ja Dall-E Artist Styles Dump ja esimerkkejä: 130 kuuluisaa tekoälyn maalaustekniikkaa |
Mikä SDXL-malli oikein on?
SDXL-malli on uusi malli, joka on tällä hetkellä koulutetaan. Se ei ole vielä läheskään valmis, ja siihen mennessä, kun se julkaistaan, monet yksityiskohdat voivat muuttua; kaiken tiedämme, sitä ei ehkä edes kutsuta SDXL-malliksi. Tiedämme vain, että se on suurempi malli, jossa on enemmän parametreja ja joitain tuntemattomia parannuksia. Se on v2-malli, ei v3-malli (mitä se tarkoittaakaan). On mahdollista, että v2-mallin parannukset voisivat parantaa järjestelmän suorituskykyä, mutta ilman lisätietoa on vaikea määrittää, kuinka merkittäviä nämä parannukset voivat olla. Lisäksi olisi hyödyllistä tietää, mitä tiettyjä parametreja on lisätty tai säädetty tähän versioon.
SDXL-malli on tällä hetkellä saatavilla DreamStudiosta, Stability AIvirallinen kuvageneraattori. Valitse mallivalikosta SDXL Beta tarkistaaksesi sen. Se näyttää käyttävän kehittyneitä algoritmeja ja syväoppimisen tekniikoita luodaksesi upeita visuaalisia kuvia, jotka sopivat täydellisesti monenlaisiin sovelluksiin.
Parannuksia
Luettavaa tekstiä. SDXL pystyy tuottamaan luettavaa tekstiä ja se on luultavasti sen silmiinpistävin ominaisuus, koska se ei ollut mahdollista olemassa olevissa v1- ja v2.1-malleissa. SDXL:n luoma teksti ei aina ole tarkkaa, kuten näet Stable Diffusion Teksti alla. Se on kuitenkin paljon parempi kuin v2.1, puhumattakaan v1-mallista. Tämä johtuu siitä, että SDXL:t käyttävät kehittyneempää syväoppimisalgoritmia, jonka avulla se voi ymmärtää ja luoda monimutkaisempia kielirakenteita. Jatkokehityksen myötä siitä voi tulla entistä tarkempi ja luotettavampi.
Ihmisen anatomia. Anatomisesti oikeiden ihmishahmojen tarkka luominen on ollut haaste jo pitkään stable diffusion. Lisäraajojen esiintyminen tai puuttuminen on yleistä. Niiden korjaamiseen käytetään yleensä maalausta, tai viime aikoina voit käyttää ControlNetin Open Pose -ominaisuutta kopioidaksesi asennon viitekuvasta. Olemme iloisia voidessamme huomata, että tässä SDXL Beta -malli on parantunut. SDXL Beta -malli on osoittanut merkittäviä parannuksia asentojen tarkassa kopioimisessa vertailukuvista. Tämä voi olla arvokas työkalu erilaisissa sovelluksissa, kuten animaatiossa ja virtuaalitodellisuudessa.
Muotokuva tyyli. SDXL Beta tuottaa erinomaisia muotokuvia, jotka näyttävät valokuvista – se on päivitys versioon 1.5 verrattuna. SDXL Betan parannettu algoritmi parantaa muotokuvien yksityiskohtia ja värien tarkkuutta, mikä tekee niistä luonnollisemman ja realistisemman. Käyttäjät voivat myös säätää terävyyttä ja kylläisyyttä saavuttaakseen haluamasi tehosteen.
Duuotone. Avainsana duotone tuottaa aina mustavalkoisia kuvia v1.5-mallissa. Nyt SDXL Betan tuottamat kaksisävykuvat ovat kuitenkin saatavilla useissa eri väreissä. On selvää, että verrattuna v1-malleihin, kyky tulkita kehotetta on parantunut, minkä seurauksena v2-malleista saadaan tarkempia ja osuvampia vastauksia, mikä tekee niistä luotettavamman työkalun luonnollisen kielen käsittelytehtäviin.
Taiteelliset tyylit. Pieniä muutoksia on tehty, mutta on vaikea määrittää, tarjoaako uusi malli parempia tuloksia, koska ne ovat yksinkertaisesti ainutlaatuisia. On mahdollista, että nämä muutokset voivat olla henkilökohtaisia mieltymyksiä tai subjektiivisia mielipiteitä, mikä vaikeuttaa a defiarvioida niiden laatua. Siitä huolimatta säätöjen ainutlaatuisuus voi olla huomionarvoista ja tutkimisen arvoista.
Yhteenveto
- Stable Diffusion voi vihdoin tuottaa järkevää tekstiä.
- SDXL tarjoaa esteettisesti miellyttävämpiä kuvia kuin v2.1- ja (vähemmässä määrin) v1.5-mallit.
- Uusi malli tuottaa tarkempia kuvia.
- Ihmisen anatomia on parantunut.
- Negatiiviset kehotteet eivät ole yhtä tarpeellisia kuin versiossa 2.1.
- Se voi luoda realistisia muotokuvia.
- Jotkut mallin omituisuudet korjataan ennen julkaisua.
Lue lisää aiheeseen liittyviä artikkeleita:
Vastuun kieltäminen
Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.
Author
Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.
lisää artikkeleitaDamir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.