Stability AI Izdaja nov model, imenovan SDXL Beta
Na kratko
Stability AI je izdal nov model, imenovan SDXL Beta (Stable Diffusion XL Beta). Je večji model z več parametri in nekaterimi neznanimi izboljšavami. Na voljo je v DreamStudio, Stability AIuradni generator slik in uporablja napredne algoritme in tehnike globokega učenja za ustvarjanje osupljivih vizualnih podob.
Stability AI je predstavil predogled novega modela, imenovanega SDXL Beta, okrajšava za Stable Diffusion XL Beta. Zaenkrat podjetje ni delilo veliko informacij o modelu, vendar je na voljo za testiranje vsem, ki to želijo. Kaj je novega pri tem modelu SDXL stable diffusion? Kakšne so njegove prednosti in slabosti? Raziskujmo.
Preberite več: Midjourney in Dall-E Artist Styles Dump s primeri: 130 znanih tehnik slikanja z umetno inteligenco |
Kaj točno je model SDXL?
Model SDXL je nov model, ki je trenutno biti usposobljen. Še zdaleč ni dokončan in do trenutka, ko bo izdan, se lahko spremeni veliko podrobnosti o njem; kolikor vemo, se morda niti ne imenuje model SDXL. Vemo le, da gre za večji model z več parametri in nekaterimi neznanimi izboljšavami. Je model v2, ne model v3 (karkoli že to pomeni). Možno je, da bi lahko izboljšave v modelu v2 izboljšale delovanje sistema, vendar je brez nadaljnjih informacij težko ugotoviti, kako pomembne so te izboljšave. Poleg tega bi bilo koristno vedeti, kateri posebni parametri so bili dodani ali prilagojeni v tej različici.
Model SDXL je trenutno na voljo v DreamStudio, Stability AIuradni generator slik. Izberite SDXL Beta v meniju modela, da ga preverite. Zdi se, da uporablja napredne algoritme in tehnike globokega učenja za ustvarjanje osupljivih vizualnih podob, ki so popolne za široko paleto aplikacij.
Izboljšave
Čitljivo besedilo. SDXL je sposoben ustvariti čitljivo besedilo in je verjetno njegova najbolj presenetljiva lastnost, saj to ni bilo mogoče v obstoječih modelih v1 in v2.1. Besedilo, ki ga ustvari SDXL, ni vedno natančno, kot lahko vidite v Stable Diffusion Besedilo spodaj. Vendar pa je veliko boljši od v2.1, kaj šele od modela v1. To je zato, ker SDXLs uporablja naprednejši algoritem globokega učenja, ki mu omogoča razumevanje in ustvarjanje kompleksnejših jezikovnih struktur. Z nadaljnjim razvojem ima potencial, da postane še bolj natančen in zanesljiv.
Človeška anatomija. Natančno ustvarjanje anatomsko pravilnih človeških figur je že dolgo izziv za stable diffusion. Prisotnost dodatnih ali manjkajočih okončin je pogosta. Inpainting se običajno uporablja za njihovo popravljanje ali, v zadnjem času, lahko uporabite ControlNetovo funkcijo Open Pose, da podvojite pozo iz referenčne slike. Z veseljem ugotavljamo, da se je tukaj model SDXL Beta izboljšal. Model SDXL Beta je pokazal znaten napredek pri natančnem podvajanju položajev iz referenčnih slik. To je lahko dragoceno orodje za različne aplikacije, kot sta animacija in virtualna resničnost.
Portretni slog. SDXL Beta ustvarja odlične portrete, ki izgledajo kot fotografije – je nadgradnja v primerjavi z različico 1.5. Izboljšan algoritem v SDXL Beta izboljša podrobnosti in barvno natančnost portretov, kar ima za posledico bolj naraven in realističen videz. Uporabniki lahko prilagodijo tudi ravni ostrine in nasičenosti, da dosežejo želene učinke.
Duotone. Ključna beseda duotone vedno proizvede črno-bele fotografije v modelu v1.5. Zdaj pa so dvotonske slike, ki jih ustvari SDXL Beta, na voljo v različnih barvah. Jasno je, da je v primerjavi z modeli v1 možnost, da razložiti poziv se je izboljšal, kar je povzročilo natančnejše in ustreznejše odzive modelov v2, zaradi česar so bolj zanesljivo orodje za naloge obdelave naravnega jezika.
Umetniški slogi. Bilo je nekaj manjših prilagoditev, vendar je težko ugotoviti, ali novi model zagotavlja boljše rezultate, saj so preprosto edinstveni. Možno je, da so te prilagoditve stvar osebnih preferenc ali subjektivnega mnenja, zaradi česar je težko narediti a definitivno presojo o njihovi kakovosti. Kljub temu je edinstvenost prilagoditev morda vredna pozornosti in vredna nadaljnjega raziskovanja.
zaključek
- Stable Diffusion lahko končno ustvari besedilo, ki je smiselno.
- SDXL zagotavlja bolj estetsko prijetne slike kot modeli v2.1 in (v manjši meri) v1.5.
- Novi model proizvaja slike, ki so natančnejše.
- Človeška anatomija se je izboljšala.
- Negativni pozivi niso tako potrebni kot v v2.1.
- Ustvari lahko realistične portrete.
- Nekatere nenavadnosti v modelu bodo popravljene pred izdajo.
Preberite več sorodnih člankov:
Zavrnitev odgovornosti
V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.
O avtorju
Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta.
več člankovDamir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta.