Stability AI Annab välja uue mudeli nimega SDXL Beta
Põgusalt
Stability AI on välja andnud uue mudeli nimega SDXL Beta (Stable Diffusion XL beeta). See on suurem mudel, millel on rohkem parameetreid ja mõned tundmatud täiustused. See on saadaval DreamStudios, Stability AIametlik pildigeneraator ning kasutab täiustatud algoritme ja süvaõppetehnikaid, et luua vapustavaid visuaale.
Stability AI avalikustas eelvaate uuest mudelist nimega SDXL Beta, mille lühend on Stable Diffusion XL beeta. Seni pole ettevõte mudeli kohta palju teavet jaganud, kuid see on testimiseks saadaval kõigile, kes seda soovivad. Mille jaoks see SDXL-mudel uudne on? stable diffusion? Millised on selle eelised ja puudused? Uurime.
Mis täpselt on SDXL mudel?
SDXL mudel on uus mudel, mis on praegu treenitakse. See pole veel kaugeltki valmis ja selle avaldamise ajaks võib palju üksikasju selle kohta muutuda; meie teada ei pruugi seda isegi SDXL-mudeliks nimetada. Teame vaid seda, et tegemist on suurema mudeliga, millel on rohkem parameetreid ja mõned tundmatud täiustused. See on v2 mudel, mitte v3 mudel (mis iganes see ka ei tähendaks). Võimalik, et v2 mudeli täiustused võivad parandada süsteemi jõudlust, kuid ilma täiendava teabeta on raske kindlaks teha, kui olulised need täiustused võivad olla. Lisaks oleks kasulik teada, milliseid konkreetseid parameetreid on selles versioonis lisatud või kohandatud.
SDXL-mudel on praegu saadaval DreamStudios, Stability AIametlik pildigeneraator. Selle kontrollimiseks valige mudelimenüüst SDXL Beta. Tundub, et see kasutab täiustatud algoritme ja süvaõppe tehnikad luua suurepäraseid visuaale, mis sobivad suurepäraselt paljude rakenduste jaoks.
Parandused
Loetav tekst. SDXL on võimeline genereerima loetavat teksti ja see on ilmselt selle kõige silmatorkavam funktsioon, kuna see ei olnud võimalik olemasolevates v1 ja v2.1 mudelites. SDXL-i loodud tekst ei ole alati täpne, nagu näete Stable Diffusion Tekst allpool. Siiski on see palju parem kui v2.1, rääkimata v1 mudelist. Seda seetõttu, et SDXL-id kasutavad täiustatud süvaõppe algoritmi, mis võimaldab mõista ja luua keerukamaid keelestruktuure. Edasise arendamise käigus võib see muutuda veelgi täpsemaks ja usaldusväärsemaks.
Inimese anatoomia. Anatoomiliselt õigete inimfiguuride täpne genereerimine on olnud pikka aega väljakutse stable diffusion. Täiendavate või puuduvate jäsemete olemasolu on tavaline. Tavaliselt kasutatakse nende parandamiseks värvimist või viimasel ajal saate kasutada ControlNeti funktsiooni Open Pose poosi dubleerimiseks võrdluspildist. Meil on hea meel tõdeda, et siin on SDXL-i beetamudel paranenud. SDXL beetamudel on näidanud märkimisväärset paranemist pooside täpsel dubleerimisel võrdluspiltidest. See võib olla väärtuslik tööriist mitmesuguste rakenduste jaoks, nagu animatsioon ja virtuaalne reaalsus.
Portree stiil. SDXL Beta loob suurepäraseid portreesid, mis näevad välja nagu fotod – see on versiooni 1.5-ga võrreldes uuendus. SDXL Beta täiustatud algoritm täiustab portreede detaile ja värvide täpsust, mille tulemuseks on loomulikum ja realistlikum välimus. Kasutajad saavad soovitud efekti saavutamiseks reguleerida ka teravuse ja küllastuse taset.
Duotone. Märksõna duotone toodab mudelis v1.5 alati must-valgeid fotosid. Nüüd on SDXL Beta toodetud kahetoonilised kujutised aga erinevates värvides. On selge, et võrreldes v1 mudelitega on võime viipa tõlgendada on paranenud, mille tulemuseks on v2 mudelite täpsemad ja asjakohasemad vastused, muutes need loomuliku keele töötlemise ülesannete jaoks usaldusväärsemaks tööriistaks.
Kunstilised stiilid. On tehtud mõningaid väiksemaid muudatusi, kuid on raske kindlaks teha, kas uus mudel annab paremaid tulemusi, kuna need on lihtsalt ainulaadsed. Võimalik, et need kohandused võivad olla isiklike eelistuste või subjektiivse arvamuse küsimus, mistõttu on keeruline a defihinnangut nende kvaliteedi kohta. Sellegipoolest võib kohanduste ainulaadsus olla tähelepanuväärne ja väärt edasist uurimist.
Järeldus
- Stable Diffusion saab lõpuks toota teksti, mis on mõistlik.
- SDXL pakub esteetiliselt meeldivamaid pilte kui v2.1 ja (vähemal määral) v1.5 mudelid.
- Uus mudel toodab pilte, mis on täpsemad.
- Inimese anatoomia on paranenud.
- Negatiivsed viibad pole nii vajalikud kui versioonis 2.1.
- See võib luua realistlikke portreesid.
- Mõned mudeli veidrused parandatakse enne vabastamist.
Loe rohkem seotud artikleid:
Kaebused
Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.
Umbes Autor
Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks.
Veel artikleidDamir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks.