Stability AI Izdaje novi model nazvan SDXL Beta
Ukratko
Stability AI je izdao novi model pod nazivom SDXL Beta (Stable Diffusion XL Beta). To je veći model s više parametara i nekim nepoznatim poboljšanjima. Dostupan je na DreamStudio, Stability AIslužbeni generator slika i koristi napredne algoritme i tehnike dubinskog učenja za stvaranje zadivljujućih slika.
Stability AI je predstavio pregled novog modela pod nazivom SDXL Beta, skraćeno od Stable Diffusion XL Beta. Do sada tvrtka nije podijelila puno informacija o modelu, ali je dostupan za testiranje svima koji to žele. Ono što je novo kod ovog SDXL modela stable diffusion? Koje su njegove prednosti i mane? Istražimo.
Pročitajte više: Midjourney i Dall-E Artist Styles Dump s primjerima: 130 poznatih AI tehnika slikanja |
Što je zapravo SDXL model?
Model SDXL je novi model koji je trenutno biti obučen. Daleko je od toga da bude završen, a do trenutka kada bude objavljen, puno detalja o njemu moglo bi se promijeniti; koliko znamo, možda se čak i ne zove SDXL model. Sve što znamo je da se radi o većem modelu s više parametara i nekim nepoznatim poboljšanjima. To je v2 model, a ne v3 model (što god to značilo). Moguće je da bi poboljšanja u modelu v2 mogla poboljšati performanse sustava, ali bez dodatnih informacija, teško je odrediti koliko bi ta poboljšanja mogla biti značajna. Osim toga, bilo bi korisno znati koji su specifični parametri dodani ili prilagođeni u ovoj verziji.
SDXL model je trenutno dostupan u DreamStudio, Stability AIslužbeni generator slika. Odaberite SDXL Beta iz izbornika modela kako biste ga provjerili. Čini se da koristi napredne algoritme i tehnike dubokog učenja za stvaranje zapanjujućih vizualnih prikaza koji su savršeni za širok raspon primjena.
Poboljšanja
Čitljiv tekst. SDXL je sposoban generirati čitljiv tekst i to je vjerojatno njegova najupečatljivija značajka jer to nije bilo moguće u postojećim modelima v1 i v2.1. SDXL generirani tekst nije uvijek točan kao što možete vidjeti u Stable Diffusion Tekst ispod. Međutim, daleko je superiorniji od v2.1, a kamoli od v1 modela. To je zato što SDXLs koristi napredniji algoritam dubokog učenja koji mu omogućuje razumijevanje i generiranje složenijih jezičnih struktura. Daljnjim razvojem ima potencijal postati još precizniji i pouzdaniji.
Anatomija čovjeka. Točna generacija anatomski ispravnih ljudskih figura dugo je bila izazov za stable diffusion. Česta je prisutnost dodatnih udova ili udova koji nedostaju. Inpainting se obično koristi za njihovo popravljanje, ili, u novije vrijeme, možete koristiti ControlNetovu značajku Open Pose za dupliciranje poze s referentne slike. Drago nam je primijetiti da je ovdje SDXL Beta model poboljšan. Model SDXL Beta pokazao je značajan napredak u preciznom kopiranju poza iz referentnih slika. Ovo može biti vrijedan alat za razne aplikacije poput animacije i virtualne stvarnosti.
Portretni stil. SDXL Beta proizvodi izvrsne portrete koji izgledaju kao fotografije – to je nadogradnja u odnosu na verziju 1.5. Poboljšani algoritam u SDXL Beta poboljšava detalje i točnost boja portreta, što rezultira prirodnijim i realističnijim izgledom. Korisnici također mogu prilagoditi razine oštrine i zasićenosti kako bi postigli željene efekte.
Duoton. Ključna riječ duotone uvijek daje crno-bijele fotografije u modelu v1.5. Međutim, sada duotone slike koje proizvodi SDXL Beta dolaze u raznim bojama. Jasno je da u usporedbi s v1 modelima, mogućnost da protumačiti upit se poboljšao, što je rezultiralo preciznijim i relevantnijim odgovorima iz modela v2, što ih čini pouzdanijim alatom za zadatke obrade prirodnog jezika.
Umjetnički stilovi. Bilo je nekih manjih prilagodbi, no teško je utvrditi daje li novi model bolje rezultate jer su jednostavno jedinstveni. Moguće je da te prilagodbe mogu biti stvar osobnih preferencija ili subjektivnog mišljenja, što otežava izradu definitivnu prosudbu o njihovoj kvaliteti. Bez obzira na to, jedinstvenost prilagodbi može biti vrijedna pažnje i vrijedna daljnjeg istraživanja.
Zaključak
- Stable Diffusion konačno mogu proizvesti tekst koji ima smisla.
- SDXL pruža estetski ugodnije slike od modela v2.1 i (u manjoj mjeri) modela v1.5.
- Novi model proizvodi slike koje su preciznije.
- Ljudska anatomija se poboljšala.
- Negativni upiti nisu potrebni kao u v2.1.
- Može stvoriti realistične portrete.
- Neke neobičnosti u modelu bit će popravljene prije izlaska.
Pročitajte više povezanih članaka:
Izjava o odricanju od odgovornosti
U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.
O autoru
Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.
Više članakaDamir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.