Aprill 10, 2023

Stability AI Annab välja uue mudeli nimega SDXL Beta

Avaldatud: 10. aprill 2023 kell 8:00 Värskendatud: 10. aprill 2023 kell 8:00

Põgusalt

Stability AI on välja andnud uue mudeli nimega SDXL Beta (Stable Diffusion XL beeta). See on suurem mudel, millel on rohkem parameetreid ja mõned tundmatud täiustused. See on saadaval DreamStudios, Stability AIametlik pildigeneraator ning kasutab täiustatud algoritme ja süvaõppetehnikaid, et luua vapustavaid visuaale.

Stability AI avalikustas eelvaate uuest mudelist nimega SDXL Beta, mille lühend on Stable Diffusion XL beeta. Seni pole ettevõte mudeli kohta palju teavet jaganud, kuid see on testimiseks saadaval kõigile, kes seda soovivad. Mille jaoks see SDXL-mudel uudne on? stable diffusion? Millised on selle eelised ja puudused? Uurime.

Loe rohkem: Midjourney ja Dall-E Artist Styles Dump koos näidetega: 130 kuulsat AI maalimistehnikat

Mis täpselt on SDXL mudel?

SDXL mudel on uus mudel, mis on praegu treenitakse. See pole veel kaugeltki valmis ja selle avaldamise ajaks võib palju üksikasju selle kohta muutuda; meie teada ei pruugi seda isegi SDXL-mudeliks nimetada. Teame vaid seda, et tegemist on suurema mudeliga, millel on rohkem parameetreid ja mõned tundmatud täiustused. See on v2 mudel, mitte v3 mudel (mis iganes see ka ei tähendaks). Võimalik, et v2 mudeli täiustused võivad parandada süsteemi jõudlust, kuid ilma täiendava teabeta on raske kindlaks teha, kui olulised need täiustused võivad olla. Lisaks oleks kasulik teada, milliseid konkreetseid parameetreid on selles versioonis lisatud või kohandatud.

SDXL-mudel on praegu saadaval DreamStudios, Stability AIametlik pildigeneraator. Selle kontrollimiseks valige mudelimenüüst SDXL Beta. Tundub, et see kasutab täiustatud algoritme ja süvaõppe tehnikad luua suurepäraseid visuaale, mis sobivad suurepäraselt paljude rakenduste jaoks.

Parandused

Loetav tekst. SDXL on võimeline genereerima loetavat teksti ja see on ilmselt selle kõige silmatorkavam funktsioon, kuna see ei olnud võimalik olemasolevates v1 ja v2.1 mudelites. SDXL-i loodud tekst ei ole alati täpne, nagu näete Stable Diffusion Tekst allpool. Siiski on see palju parem kui v2.1, rääkimata v1 mudelist. Seda seetõttu, et SDXL-id kasutavad täiustatud süvaõppe algoritmi, mis võimaldab mõista ja luua keerukamaid keelestruktuure. Edasise arendamise käigus võib see muutuda veelgi täpsemaks ja usaldusväärsemaks.

Viip: foto härrasmehest, kes hoiab käes valget paberit, millel on kirjas „No Fakes”

Foto punapäisest naisest, kellel on valgete kirjatüüpidega must silt "No Jokes" — Viip: foto punapäisest naisest, kellel on valgete kirjatüüpidega must silt "Nalja pole"

Viip: foto hiinlannast, kes istub kinos ja hoiab käes taldrikut, millele on kirjutatud "Pain and Plane". — Viip: foto hiinlannast, kes istub kinos, hoides taldrikut, millele on kirjutatud “Pain and Plane”.

Inimese anatoomia. Anatoomiliselt õigete inimfiguuride täpne genereerimine on olnud pikka aega väljakutse stable diffusion. Täiendavate või puuduvate jäsemete olemasolu on tavaline. Tavaliselt kasutatakse nende parandamiseks värvimist või viimasel ajal saate kasutada ControlNeti funktsiooni Open Pose poosi dubleerimiseks võrdluspildist. Meil on hea meel tõdeda, et siin on SDXL-i beetamudel paranenud. SDXL beetamudel on näidanud märkimisväärset paranemist pooside täpsel dubleerimisel võrdluspiltidest. See võib olla väärtuslik tööriist mitmesuguste rakenduste jaoks, nagu animatsioon ja virtuaalne reaalsus.

Foto spordiriietuses naisest, kes keerutab palli paremas käes — Viip: foto spordiriietuses naisest, kes keerutab palli paremas käes

Foto poisist, kes istub punase kuu all — Viip: foto poisist, kes istub punase kuu all

Viip: fotol on metsas jooksmas vanamees.

Portree stiil. SDXL Beta loob suurepäraseid portreesid, mis näevad välja nagu fotod – see on versiooni 1.5-ga võrreldes uuendus. SDXL Beta täiustatud algoritm täiustab portreede detaile ja värvide täpsust, mille tulemuseks on loomulikum ja realistlikum välimus. Kasutajad saavad soovitud efekti saavutamiseks reguleerida ka teravuse ja küllastuse taset.

Duotone. Märksõna duotone toodab mudelis v1.5 alati must-valgeid fotosid. Nüüd on SDXL Beta toodetud kahetoonilised kujutised aga erinevates värvides. On selge, et võrreldes v1 mudelitega on võime viipa tõlgendada on paranenud, mille tulemuseks on v2 mudelite täpsemad ja asjakohasemad vastused, muutes need loomuliku keele töötlemise ülesannete jaoks usaldusväärsemaks tööriistaks.

Viip: kahetoonilises stiilis koera portree

Viip: kahetooniline portree noorest aafriklannast

Kunstilised stiilid. On tehtud mõningaid väiksemaid muudatusi, kuid on raske kindlaks teha, kas uus mudel annab paremaid tulemusi, kuna need on lihtsalt ainulaadsed. Võimalik, et need kohandused võivad olla isiklike eelistuste või subjektiivse arvamuse küsimus, mistõttu on keeruline a defihinnangut nende kvaliteedi kohta. Sellegipoolest võib kohanduste ainulaadsus olla tähelepanuväärne ja väärt edasist uurimist.

Ivan Aivazovski New York — v 1.5: New York, autor Ivan Aivazovski

v 1.5: Vana mets, autor Christopher Balaskas

Järeldus

Stable Diffusion saab lõpuks toota teksti, mis on mõistlik.
SDXL pakub esteetiliselt meeldivamaid pilte kui v2.1 ja (vähemal määral) v1.5 mudelid.
Uus mudel toodab pilte, mis on täpsemad.
Inimese anatoomia on paranenud.
Negatiivsed viibad pole nii vajalikud kui versioonis 2.1.
See võib luua realistlikke portreesid.
Mõned mudeli veidrused parandatakse enne vabastamist.

Loe rohkem seotud artikleid:

Sildid:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks.

Veel artikleid

Damir Jalalov