Stability AI Išleidžia naują modelį, pavadintą SDXL Beta
Trumpai
Stability AI išleido naują modelį pavadinimu SDXL Beta (Stable Diffusion XL Beta). Tai didesnis modelis su daugiau parametrų ir kai kurių nežinomų patobulinimų. Jį galima rasti „DreamStudio“, Stability AIyra oficialus vaizdų generatorius ir naudoja pažangius algoritmus bei gilaus mokymosi metodus, kad sukurtų nuostabius vaizdus.
Stability AI pristatė naujo modelio, pavadinto SDXL Beta, trumpinį, peržiūrą Stable Diffusion XL Beta. Kol kas įmonė daug informacijos apie modelį nepasidalijo, tačiau jį išbandyti gali visi norintys. Kuo naujas šis SDXL modelis? stable diffusion? Kokie jo privalumai ir trūkumai? Ištirkime.
Plačiau paskaitykite čia: Midjourney ir Dall-E atlikėjų stilių sąvartynas su pavyzdžiais: 130 garsių dirbtinio intelekto dažymo būdų |
Kas tiksliai yra SDXL modelis?
SDXL modelis yra naujas modelis, kuris šiuo metu yra yra treniruojamas. Jis dar toli gražu nebaigtas, o kol bus išleistas, gali pasikeisti daug detalių; Kiek mes žinome, jis gali būti net nevadinamas SDXL modeliu. Žinome tik tai, kad tai didesnis modelis su daugiau parametrų ir kai kurių nežinomų patobulinimų. Tai v2 modelis, o ne v3 modelis (kad ir ką tai reikštų). Gali būti, kad v2 modelio patobulinimai galėtų pagerinti sistemos našumą, tačiau be papildomos informacijos sunku nustatyti, kiek reikšmingi šie patobulinimai gali būti. Be to, būtų naudinga žinoti, kokie konkretūs parametrai buvo įtraukti arba pakoreguoti šioje versijoje.
SDXL modelis šiuo metu pasiekiamas DreamStudio, Stability AIoficialus vaizdo generatorius. Modelio meniu pasirinkite SDXL Beta ir patikrinkite. Atrodo, kad naudojami pažangūs algoritmai ir gilaus mokymosi technikos sukurti nuostabius vaizdus, kurie puikiai tinka įvairioms programoms.
Patobulinimai
Įskaitomas tekstas. SDXL gali generuoti įskaitomą tekstą ir tai tikriausiai yra ryškiausia jos savybė, nes tai nebuvo įmanoma esamuose v1 ir v2.1 modeliuose. SDXL sugeneruotas tekstas ne visada yra tikslus, kaip matote Stable Diffusion Tekstas žemiau. Tačiau jis yra daug pranašesnis už v2.1, jau nekalbant apie v1 modelį. Taip yra todėl, kad SDXL naudoja pažangesnį giluminio mokymosi algoritmą, leidžiantį suprasti ir generuoti sudėtingesnes kalbos struktūras. Toliau tobulinant, jis gali tapti dar tikslesnis ir patikimesnis.
Žmogaus anatomija. Tiksli anatomiškai teisingų žmogaus figūrų generavimas jau seniai buvo iššūkis stable diffusion. Dažnai atsiranda papildomų galūnių arba jų trūksta. Jiems pataisyti paprastai naudojamas dažymas arba, neseniai, galite naudoti „ControlNet“ atviros pozos funkciją, norėdami kopijuoti pozą iš atskaitos vaizdo. Džiaugiamės galėdami pastebėti, kad čia patobulėjo SDXL Beta modelis. SDXL Beta modelis parodė reikšmingą pagerėjimą tiksliai atkartojant pozas iš etaloninių vaizdų. Tai gali būti vertinga priemonė įvairioms programoms, tokioms kaip animacija ir virtualioji realybė.
Portreto stilius. SDXL Beta sukuria puikius portretus, kurie atrodo kaip nuotraukos – tai patobulinimas, palyginti su 1.5 versija. Patobulintas SDXL Beta algoritmas pagerina portretų detales ir spalvų tikslumą, todėl vaizdas atrodo natūralesnis ir tikroviškesnis. Vartotojai taip pat gali reguliuoti ryškumo ir sodrumo lygius, kad pasiektų norimus efektus.
Duotone. Raktažodis duotone visada sukuria nespalvotas nuotraukas v1.5 modelyje. Tačiau dabar SDXL Beta gaminami dvitoniai vaizdai yra įvairių spalvų. Akivaizdu, kad lyginant su v1 modeliais, galimybė interpretuoti raginimą patobulinta, todėl v2 modeliai pateikia tikslesnius ir tinkamesnius atsakymus, todėl jie yra patikimesnis įrankis atliekant natūralios kalbos apdorojimo užduotis.
Meniniai stiliai. Buvo atlikti nedideli pakeitimai, tačiau sunku nustatyti, ar naujasis modelis suteikia geresnių rezultatų, nes jie tiesiog unikalūs. Gali būti, kad šie koregavimai gali priklausyti nuo asmeninių pageidavimų arba subjektyvios nuomonės, todėl sunku atlikti a defijų kokybės vertinimas. Nepaisant to, koregavimų unikalumas gali būti vertas dėmesio ir vertas tolesnio tyrimo.
Išvada
- Stable Diffusion pagaliau gali sukurti prasmingą tekstą.
- SDXL suteikia estetiškesnius vaizdus nei v2.1 ir (mažesniu mastu) v1.5 modeliai.
- Naujasis modelis sukuria tikslesnius vaizdus.
- Žmogaus anatomija pagerėjo.
- Neigiami raginimai nėra tokie būtini kaip v2.1.
- Jis gali sukurti tikroviškus portretus.
- Kai kurios modelio keistenybės bus ištaisytos prieš išleidžiant.
Skaitykite daugiau susijusių straipsnių:
Atsakomybės neigimas
Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.
Apie autorių
Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže.
Daugiau straipsniųDamiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže.