Naujienų ataskaita Technologija
Balandis 10, 2023

Stability AI Išleidžia naują modelį, pavadintą SDXL Beta

Trumpai

Stability AI išleido naują modelį pavadinimu SDXL Beta (Stable Diffusion XL Beta). Tai didesnis modelis su daugiau parametrų ir kai kurių nežinomų patobulinimų. Jį galima rasti „DreamStudio“, Stability AIyra oficialus vaizdų generatorius ir naudoja pažangius algoritmus bei gilaus mokymosi metodus, kad sukurtų nuostabius vaizdus.

Stability AI pristatė naujo modelio, pavadinto SDXL Beta, trumpinį, peržiūrą Stable Diffusion XL Beta. Kol kas įmonė daug informacijos apie modelį nepasidalijo, tačiau jį išbandyti gali visi norintys. Kuo naujas šis SDXL modelis? stable diffusion? Kokie jo privalumai ir trūkumai? Ištirkime.

Plačiau paskaitykite čia: Midjourney ir Dall-E atlikėjų stilių sąvartynas su pavyzdžiais: 130 garsių dirbtinio intelekto dažymo būdų

Kas tiksliai yra SDXL modelis?

SDXL modelis yra naujas modelis, kuris šiuo metu yra yra treniruojamas. Jis dar toli gražu nebaigtas, o kol bus išleistas, gali pasikeisti daug detalių; Kiek mes žinome, jis gali būti net nevadinamas SDXL modeliu. Žinome tik tai, kad tai didesnis modelis su daugiau parametrų ir kai kurių nežinomų patobulinimų. Tai v2 modelis, o ne v3 modelis (kad ir ką tai reikštų). Gali būti, kad v2 modelio patobulinimai galėtų pagerinti sistemos našumą, tačiau be papildomos informacijos sunku nustatyti, kiek reikšmingi šie patobulinimai gali būti. Be to, būtų naudinga žinoti, kokie konkretūs parametrai buvo įtraukti arba pakoreguoti šioje versijoje.

SDXL modelis šiuo metu pasiekiamas DreamStudio, Stability AIoficialus vaizdo generatorius. Modelio meniu pasirinkite SDXL Beta ir patikrinkite. Atrodo, kad naudojami pažangūs algoritmai ir gilaus mokymosi technikos sukurti nuostabius vaizdus, ​​​​kurie puikiai tinka įvairioms programoms.

Kas tiksliai yra SDXL modelis?

Patobulinimai

Įskaitomas tekstas. SDXL gali generuoti įskaitomą tekstą ir tai tikriausiai yra ryškiausia jos savybė, nes tai nebuvo įmanoma esamuose v1 ir v2.1 modeliuose. SDXL sugeneruotas tekstas ne visada yra tikslus, kaip matote Stable Diffusion Tekstas žemiau. Tačiau jis yra daug pranašesnis už v2.1, jau nekalbant apie v1 modelį. Taip yra todėl, kad SDXL naudoja pažangesnį giluminio mokymosi algoritmą, leidžiantį suprasti ir generuoti sudėtingesnes kalbos struktūras. Toliau tobulinant, jis gali tapti dar tikslesnis ir patikimesnis.

Raginimas: džentelmeno nuotrauka, laikanti baltą popierių su užrašu „No Fakes“
Raginimas: džentelmeno nuotrauka, laikanti baltą popierių su užrašu „No Fakes“
Raudonplaukės moters nuotrauka, laikanti juodą ženklą su baltais šriftais su užrašu „Jokių juokų“
Raginimas: nuotrauka, kurioje raudonplaukė moteris laiko juodą ženklą su baltais šriftais su užrašu „Jokių juokų“
Raginimas: Kino moters, sėdinčios kino teatre, nuotrauka, laikanti lėkštę su užrašu „Pain and Plane“.
Raginimas: Kino moters, sėdinčios kino teatre, nuotrauka, laikanti lėkštę su užrašu „Pain and Plane“.

Žmogaus anatomija. Tiksli anatomiškai teisingų žmogaus figūrų generavimas jau seniai buvo iššūkis stable diffusion. Dažnai atsiranda papildomų galūnių arba jų trūksta. Jiems pataisyti paprastai naudojamas dažymas arba, neseniai, galite naudoti „ControlNet“ atviros pozos funkciją, norėdami kopijuoti pozą iš atskaitos vaizdo. Džiaugiamės galėdami pastebėti, kad čia patobulėjo SDXL Beta modelis. SDXL Beta modelis parodė reikšmingą pagerėjimą tiksliai atkartojant pozas iš etaloninių vaizdų. Tai gali būti vertinga priemonė įvairioms programoms, tokioms kaip animacija ir virtualioji realybė.

Nuotrauka, kurioje moteris su sportine apranga suka kamuolį dešinėje rankoje
Raginimas: nuotrauka, kurioje moteris su sportine apranga suka kamuolį dešinėje rankoje
Berniuko, sėdinčio po raudonu mėnuliu, nuotrauka
Raginimas: berniuko, sėdinčio po raudonu mėnuliu, nuotrauka
Raginimas: nuotraukoje pavaizduotas senas vyras, bėgantis miške.

Portreto stilius. SDXL Beta sukuria puikius portretus, kurie atrodo kaip nuotraukos – tai patobulinimas, palyginti su 1.5 versija. Patobulintas SDXL Beta algoritmas pagerina portretų detales ir spalvų tikslumą, todėl vaizdas atrodo natūralesnis ir tikroviškesnis. Vartotojai taip pat gali reguliuoti ryškumo ir sodrumo lygius, kad pasiektų norimus efektus.

Raginimas: berniuko ir mergaitės nuotrauka
Raginimas: berniuko ir mergaitės nuotrauka
Raginimas: storo vaikino portretinė nuotrauka
Raginimas: storo vaikino portretinė nuotrauka
Raginimas: 80-ųjų moters nuotrauka
Raginimas: 80-ųjų moters nuotrauka

Duotone. Raktažodis duotone visada sukuria nespalvotas nuotraukas v1.5 modelyje. Tačiau dabar SDXL Beta gaminami dvitoniai vaizdai yra įvairių spalvų. Akivaizdu, kad lyginant su v1 modeliais, galimybė interpretuoti raginimą patobulinta, todėl v2 modeliai pateikia tikslesnius ir tinkamesnius atsakymus, todėl jie yra patikimesnis įrankis atliekant natūralios kalbos apdorojimo užduotis.

dvitonio stiliaus šuns portretas
Raginimas: dvitonio stiliaus šuns portretas
dvitonis salos peizažas
Raginimas: dvitonis salos kraštovaizdis
dvitonis jaunos afrikietės portretas
Raginimas: dvitonis jaunos afrikietės portretas

Meniniai stiliai. Buvo atlikti nedideli pakeitimai, tačiau sunku nustatyti, ar naujasis modelis suteikia geresnių rezultatų, nes jie tiesiog unikalūs. Gali būti, kad šie koregavimai gali priklausyti nuo asmeninių pageidavimų arba subjektyvios nuomonės, todėl sunku atlikti a defijų kokybės vertinimas. Nepaisant to, koregavimų unikalumas gali būti vertas dėmesio ir vertas tolesnio tyrimo.

Ivanas Aivazovskis Niujorke
1.5 versija: Ivanas Aivazovskis, Niujorkas
Ivanas Aivazovskis Niujorke
SDXL: Niujorkas, Ivanas Aivazovskis
Kristoforo Balasko „Senoji giria“.
v 1.5: Senasis miškas, Christopheris Balaskas
Kristoforo Balasko „Senoji giria“.
SDXL: Senasis miškas, Christopheris Balaskas

Išvada

  • Stable Diffusion pagaliau gali sukurti prasmingą tekstą.
  • SDXL suteikia estetiškesnius vaizdus nei v2.1 ir (mažesniu mastu) v1.5 modeliai.
  • Naujasis modelis sukuria tikslesnius vaizdus.
  • Žmogaus anatomija pagerėjo.
  • Neigiami raginimai nėra tokie būtini kaip v2.1.
  • Jis gali sukurti tikroviškus portretus.
  • Kai kurios modelio keistenybės bus ištaisytos prieš išleidžiant.

Skaitykite daugiau susijusių straipsnių:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Daugiau straipsnių
Damiras Jalalovas
Damiras Jalalovas

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Ateina nuosprendžio paskelbimo diena: CZ likimas subalansuotas, nes JAV teismas svarsto DOJ prašymą

Changpeng Zhao šiandien laukia nuosprendžio JAV teisme Sietle.

Žinoti daugiau

Samourai piniginės įkūrėjai apkaltinti palengvinę 2 mlrd. USD „Darknet“ sandorius

„Samourai Wallet“ įkūrėjų nuogąstavimai yra reikšmingas pramonės nuosmukis, pabrėžiantis nuolatinį ...

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
„Ankr“ bendradarbiauja su AI „Blockchain“ platformos „Talus“ tinklu, siekdamas atrakinti „Bitcoin“ likvidumą AI
Atsakingas verslas Naujienų ataskaita Technologija
„Ankr“ bendradarbiauja su AI „Blockchain“ platformos „Talus“ tinklu, siekdamas atrakinti „Bitcoin“ likvidumą AI
Gali 1, 2024
„Binance Labs“ palaiko judėjimo laboratorijas, kad palengvintų „Facebook“ judėjimo integraciją visose blokų grandinėse
Atsakingas verslas Naujienų ataskaita Technologija
„Binance Labs“ palaiko judėjimo laboratorijas, kad palengvintų „Facebook“ judėjimo integraciją visose blokų grandinėse
Gali 1, 2024
BRICS Nations Eye Stablecoin prekybos sprendimas
Atsakingas verslas rinkos Istorijos ir apžvalgos Technologija
BRICS Nations Eye Stablecoin prekybos sprendimas
Gali 1, 2024
Bitcoin L2 Network BOB integruojasi su LayerZero, kad pagerintų funkcionalumą
Atsakingas verslas Naujienų ataskaita Technologija
Bitcoin L2 Network BOB integruojasi su LayerZero, kad pagerintų funkcionalumą
Gali 1, 2024
CRYPTOMERIA LABS PTE. LTD.