Novice Tehnologija
April 10, 2023

Stability AI Izdaja nov model, imenovan SDXL Beta

Na kratko

Stability AI je izdal nov model, imenovan SDXL Beta (Stable Diffusion XL Beta). Je večji model z več parametri in nekaterimi neznanimi izboljšavami. Na voljo je v DreamStudio, Stability AIuradni generator slik in uporablja napredne algoritme in tehnike globokega učenja za ustvarjanje osupljivih vizualnih podob.

Stability AI je predstavil predogled novega modela, imenovanega SDXL Beta, okrajšava za Stable Diffusion XL Beta. Zaenkrat podjetje ni delilo veliko informacij o modelu, vendar je na voljo za testiranje vsem, ki to želijo. Kaj je novega pri tem modelu SDXL stable diffusion? Kakšne so njegove prednosti in slabosti? Raziskujmo.

Preberite več: Midjourney in Dall-E Artist Styles Dump s primeri: 130 znanih tehnik slikanja z umetno inteligenco

Kaj točno je model SDXL?

Model SDXL je nov model, ki je trenutno biti usposobljen. Še zdaleč ni dokončan in do trenutka, ko bo izdan, se lahko spremeni veliko podrobnosti o njem; kolikor vemo, se morda niti ne imenuje model SDXL. Vemo le, da gre za večji model z več parametri in nekaterimi neznanimi izboljšavami. Je model v2, ne model v3 (karkoli že to pomeni). Možno je, da bi lahko izboljšave v modelu v2 izboljšale delovanje sistema, vendar je brez nadaljnjih informacij težko ugotoviti, kako pomembne so te izboljšave. Poleg tega bi bilo koristno vedeti, kateri posebni parametri so bili dodani ali prilagojeni v tej različici.

Model SDXL je trenutno na voljo v DreamStudio, Stability AIuradni generator slik. Izberite SDXL Beta v meniju modela, da ga preverite. Zdi se, da uporablja napredne algoritme in tehnike globokega učenja za ustvarjanje osupljivih vizualnih podob, ki so popolne za široko paleto aplikacij.

Kaj točno je model SDXL?

Izboljšave

Čitljivo besedilo. SDXL je sposoben ustvariti čitljivo besedilo in je verjetno njegova najbolj presenetljiva lastnost, saj to ni bilo mogoče v obstoječih modelih v1 in v2.1. Besedilo, ki ga ustvari SDXL, ni vedno natančno, kot lahko vidite v Stable Diffusion Besedilo spodaj. Vendar pa je veliko boljši od v2.1, kaj šele od modela v1. To je zato, ker SDXLs uporablja naprednejši algoritem globokega učenja, ki mu omogoča razumevanje in ustvarjanje kompleksnejših jezikovnih struktur. Z nadaljnjim razvojem ima potencial, da postane še bolj natančen in zanesljiv.

Poziv: fotografija gospoda, ki drži bel papir z napisom »Brez ponaredkov«
Poziv: fotografija gospoda, ki drži bel papir z napisom »Brez ponaredkov«
Fotografija rdečelase ženske, ki drži črn napis z belimi pisavami, na katerem piše "Brez šale"
Poziv: Fotografija rdečelase ženske, ki drži črn znak z belimi pisavami, na katerem piše "Brez šale"
Poziv: Fotografija Kitajke, ki sedi v kinu in drži krožnik z napisom "Pain and Plane".
Poziv: Fotografija Kitajke, ki sedi v kinu in drži krožnik z napisom »Pain and Plane«.

Človeška anatomija. Natančno ustvarjanje anatomsko pravilnih človeških figur je že dolgo izziv za stable diffusion. Prisotnost dodatnih ali manjkajočih okončin je pogosta. Inpainting se običajno uporablja za njihovo popravljanje ali, v zadnjem času, lahko uporabite ControlNetovo funkcijo Open Pose, da podvojite pozo iz referenčne slike. Z veseljem ugotavljamo, da se je tukaj model SDXL Beta izboljšal. Model SDXL Beta je pokazal znaten napredek pri natančnem podvajanju položajev iz referenčnih slik. To je lahko dragoceno orodje za različne aplikacije, kot sta animacija in virtualna resničnost.

Fotografija ženske v športni opravi, ki vrti žogo v desni roki
Poziv: Fotografija ženske v športni opravi, ki vrti žogo v desni roki
Fotografija dečka, ki sedi pod rdečo luno
Poziv: Fotografija dečka, ki sedi pod rdečo luno
Poziv: Fotografija prikazuje starca, ki teče po gozdu.

Portretni slog. SDXL Beta ustvarja odlične portrete, ki izgledajo kot fotografije – je nadgradnja v primerjavi z različico 1.5. Izboljšan algoritem v SDXL Beta izboljša podrobnosti in barvno natančnost portretov, kar ima za posledico bolj naraven in realističen videz. Uporabniki lahko prilagodijo tudi ravni ostrine in nasičenosti, da dosežejo želene učinke.

Poziv: slika fantka in deklice
Poziv: slika fantka in deklice
Poziv: portretna fotografija debeluha
Poziv: portretna fotografija debeluha
Poziv: fotografija ženske iz 80-ih
Poziv: fotografija ženske iz 80-ih

Duotone. Ključna beseda duotone vedno proizvede črno-bele fotografije v modelu v1.5. Zdaj pa so dvotonske slike, ki jih ustvari SDXL Beta, na voljo v različnih barvah. Jasno je, da je v primerjavi z modeli v1 možnost, da razložiti poziv se je izboljšal, kar je povzročilo natančnejše in ustreznejše odzive modelov v2, zaradi česar so bolj zanesljivo orodje za naloge obdelave naravnega jezika.

dvobarvni portret psa
Poziv: dvobarvni portret psa
dvobarvna pokrajina otoka
Poziv: dvobarvna pokrajina otoka
dvobarvni portret mlade afriške ženske
Poziv: dvobarvni portret mlade Afričanke

Umetniški slogi. Bilo je nekaj manjših prilagoditev, vendar je težko ugotoviti, ali novi model zagotavlja boljše rezultate, saj so preprosto edinstveni. Možno je, da so te prilagoditve stvar osebnih preferenc ali subjektivnega mnenja, zaradi česar je težko narediti a definitivno presojo o njihovi kakovosti. Kljub temu je edinstvenost prilagoditev morda vredna pozornosti in vredna nadaljnjega raziskovanja.

New York Ivana Aivazovskega
v 1.5: New York Ivana Aivazovskega
New York Ivana Aivazovskega
SDXL: New York Ivana Aivazovskega
Stari gozd Christopherja Balaskasa
v 1.5: Stari gozd Christopherja Balaskasa
Stari gozd Christopherja Balaskasa
SDXL: Stari gozd Christopherja Balaskasa

zaključek

  • Stable Diffusion lahko končno ustvari besedilo, ki je smiselno.
  • SDXL zagotavlja bolj estetsko prijetne slike kot modeli v2.1 in (v manjši meri) v1.5.
  • Novi model proizvaja slike, ki so natančnejše.
  • Človeška anatomija se je izboljšala.
  • Negativni pozivi niso tako potrebni kot v v2.1.
  • Ustvari lahko realistične portrete.
  • Nekatere nenavadnosti v modelu bodo popravljene pred izdajo.

Preberite več sorodnih člankov:

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

več člankov
Damir Yalalov
Damir Yalalov

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

Hot Stories
Pridružite se našemu glasilu.
Zadnje novice

Prihaja dan obsodbe: usoda CZ visi na ravnovesju, ko ameriško sodišče obravnava tožbeni razlog DOJ

Changpeng Zhao se danes sooča z obsodbo na ameriškem sodišču v Seattlu.

Več o tem

Ustanovitelji denarnice Samourai Wallet obtoženi omogočanja 2 milijard dolarjev pri poslih Darknet

Zaskrbljenost ustanoviteljev denarnice Samourai Wallet predstavlja opazno nazadovanje za industrijo, ki poudarja vztrajno ...

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
Ankr sodeluje s platformo AI Blockchain Talus Network za odklepanje likvidnosti bitcoinov za AI
ŽELITE POSTATI PARTNER Novice Tehnologija
Ankr sodeluje s platformo AI Blockchain Talus Network za odklepanje likvidnosti bitcoinov za AI
Maj 1, 2024
Binance Labs podpira Movement Labs, da bi olajšal Facebookovo integracijo Move v verigah blokov
ŽELITE POSTATI PARTNER Novice Tehnologija
Binance Labs podpira Movement Labs, da bi olajšal Facebookovo integracijo Move v verigah blokov
Maj 1, 2024
BRICS Nations Eye Rešitev za trgovanje s stabilnimi kovanci
ŽELITE POSTATI PARTNER Prisotnost Zgodbe in ocene Tehnologija
BRICS Nations Eye Rešitev za trgovanje s stabilnimi kovanci
Maj 1, 2024
Bitcoin L2 omrežje BOB se integrira z LayerZero za izboljšano funkcionalnost
ŽELITE POSTATI PARTNER Novice Tehnologija
Bitcoin L2 omrežje BOB se integrira z LayerZero za izboljšano funkcionalnost
Maj 1, 2024
CRYPTOMERIA LABS PTE. LTD.