Nyheds rapport Teknologier
April 10, 2023

Stability AI Frigiver en ny model kaldet SDXL Beta

Kort sagt

Stability AI har udgivet en ny model kaldet SDXL Beta (Stable Diffusion XL Beta). Det er en større model med flere parametre og nogle ukendte forbedringer. Den er tilgængelig på DreamStudio, Stability AI's officielle billedgenerator, og bruger avancerede algoritmer og dyb læringsteknikker til at skabe fantastiske billeder.

Stability AI har afsløret en forhåndsvisning af en ny model kaldet SDXL Beta, en forkortelse for Stable Diffusion XL Beta. Indtil videre har virksomheden ikke delt meget information om modellen, men den er tilgængelig til test for alle, der ønsker at gøre det. Hvad er nyt ved denne SDXL-model til stable diffusion? Hvad er dens fordele og ulemper? Lad os undersøge det.

Læs mere: Midjourney og Dall-E Artist Styles Dump med eksempler: 130 berømte AI-maleteknikker

Hvad er SDXL-modellen helt præcist?

SDXL-modellen er en ny model, der pt bliver trænet. Den er langt fra færdig, og inden den udkommer, kan en masse detaljer om den ændre sig; for alt hvad vi ved, kaldes den måske ikke engang SDXL-modellen. Det eneste vi ved er, at det er en større model med flere parametre og nogle ukendte forbedringer. Det er en v2-model, ikke en v3-model (hvad det så end betyder). Det er muligt, at forbedringerne i v2-modellen kunne forbedre systemets ydeevne, men uden yderligere information er det svært at afgøre, hvor væsentlige disse forbedringer kan være. Derudover ville det være nyttigt at vide, hvilke specifikke parametre der er blevet tilføjet eller justeret i denne version.

SDXL-modellen er i øjeblikket tilgængelig på DreamStudio, Stability AI's officielle billedgenerator. Vælg SDXL Beta fra modelmenuen for at tjekke det ud. Det ser ud til at bruge avancerede algoritmer og deep learning teknikker at skabe fantastiske billeder, der er perfekte til en lang række applikationer.

Hvad er SDXL-modellen helt præcist?

Forbedringer

Læselig tekst. SDXL er i stand til at generere læselig tekst, og det er nok dens mest slående egenskab, da det ikke var muligt i de eksisterende v1 og v2.1 modeller. SDXL's genererede tekst er ikke altid nøjagtig, som du kan se i Stable Diffusion Tekst nedenfor. Den er dog langt overlegen i forhold til v2.1, endsige v1-modellen. Dette skyldes, at SDXL'er bruger en mere avanceret deep learning-algoritme, der gør det muligt at forstå og generere mere komplekse sprogstrukturer. Med yderligere udvikling har den potentiale til at blive endnu mere præcis og pålidelig.

Spørgsmål: foto af en herre, der holder et hvidt papir, hvor der står "No Fakes"
Spørgsmål: foto af en herre, der holder et hvidt papir, hvor der står "No Fakes"
Foto af en rødhåret kvinde med et sort skilt med hvide skrifttyper, hvor der står "No Jokes"
Spørgsmål: Foto af en rødhåret kvinde, der holder et sort skilt med hvide skrifttyper, hvor der står "No Jokes"
Spørgsmål: Foto af en kinesisk kvinde, der sidder i en biograf med en tallerken med ordet "Pain and Plane" skrevet på.
Spørgsmål: Foto af en kinesisk kvinde, der sidder i en biograf med en tallerken med ordet "Pain and Plane" skrevet på.

Menneskets anatomi. Den nøjagtige generering af anatomisk korrekte menneskefigurer har længe været en udfordring for stable diffusion. Tilstedeværelsen af ​​yderligere eller manglende lemmer er almindelig. Inpainting bruges typisk til at rette dem, eller for nylig kan du bruge ControlNets Open Pose-funktion til at duplikere en positur fra et referencebillede. Vi er glade for at bemærke, at det er her, SDXL Beta-modellen er blevet forbedret. SDXL Beta-modellen har vist betydelige forbedringer i nøjagtigt at kopiere positurer fra referencebilleder. Dette kan være et værdifuldt værktøj til forskellige applikationer såsom animation og virtual reality.

Foto af en kvinde i et sportstøj, der spinder bolden i højre hånd
Spørgsmål: Foto af en kvinde i et sportstøj, der snurrer bolden i højre hånd
Foto af en dreng, der sidder under den røde måne
Spørgsmål: Foto af en dreng, der sidder under den røde måne
Spørgsmål: Et billede viser en gammel mand, der løber i skoven.

Portræt stil. SDXL Beta producerer fremragende portrætter, der ligner billeder – det er en opgradering i forhold til version 1.5. Den forbedrede algoritme i SDXL Beta forbedrer detaljerne og farvenøjagtigheden af ​​portrætterne, hvilket resulterer i et mere naturligt og realistisk udseende. Brugere kan også justere niveauerne af skarphed og mætning for at opnå deres ønskede effekter.

Spørgsmål: et billede af en dreng og pige
Spørgsmål: et billede af en dreng og pige
Spørgsmål: et portrætbillede af en fed fyr
Spørgsmål: et portrætbillede af en fed fyr
Spørgsmål: et fotobillede af en kvinde fra 80'erne
Spørgsmål: et fotobillede af en kvinde fra 80'erne

Duotone. Nøgleordet duotone producerer altid sort-hvide fotos i v1.5-modellen. Men nu kommer duotone-billederne produceret af SDXL Beta i en række forskellige farver. Det er klart, at i forhold til v1-modeller, er evnen til fortolke prompten er blevet forbedret, hvilket resulterer i mere præcise og relevante svar fra v2-modellerne, hvilket gør dem til et mere pålideligt værktøj til behandling af naturlige sprog.

duotone stil portræt af en hund
Spørgsmål: duotone stil portræt af en hund
duotone landskab på øen
Spørgsmål: duotone landskab på øen
duotone portræt af ung afrikansk kvinde
Spørgsmål: duotone portræt af ung afrikansk kvinde

Kunstneriske stilarter. Der har været nogle mindre justeringer, men det er svært at afgøre, om den nye model giver bedre resultater, da de simpelthen er unikke. Det er muligt, at disse justeringer kan være et spørgsmål om personlig præference eller subjektiv mening, hvilket gør det vanskeligt at foretage en definiv bedømmelse af deres kvalitet. Ikke desto mindre kan det unikke ved justeringerne være bemærkelsesværdigt og værd at undersøge nærmere.

New York af Ivan Aivazovsky
v 1.5: New York af Ivan Aivazovsky
New York af Ivan Aivazovsky
SDXL: New York af Ivan Aivazovsky
Old Forest af Christopher Balaskas
v 1.5: Old Forest af Christopher Balaskas
Old Forest af Christopher Balaskas
SDXL: Old Forest af Christopher Balaskas

Konklusion

  • Stable Diffusion endelig kan producere tekst, der giver mening.
  • SDXL giver mere æstetisk tiltalende billeder end v2.1- og (i mindre grad) v1.5-modellerne.
  • Den nye model producerer billeder, der er mere nøjagtige.
  • Menneskets anatomi er blevet forbedret.
  • Negative prompter er ikke så nødvendige som i v2.1.
  • Det kan skabe realistiske portrætter.
  • Nogle mærkværdigheder i modellen vil blive rettet inden udgivelsen.

Læs flere relaterede artikler:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Hot Stories

BRICS Nations Eye Stablecoin Trade Solution

by Viktoria Palchik
Maj 01, 2024
Tilmeld dig vores nyhedsbrev.
Seneste Nyheder

Straffeudmålingsdagen ankommer: CZ's skæbne hænger i balance, da amerikansk domstol overvejer DOJ's anbringende

Changpeng Zhao står klar til at blive dømt ved en amerikansk domstol i Seattle i dag.

Vide mere

Samourai Wallet Founders anklaget for at facilitere $2B i Darknet-tilbud

Frygten fra Samourai Wallet-grundlæggerne repræsenterer et bemærkelsesværdigt tilbageslag for industrien, hvilket understreger den vedvarende ...

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
Ankr samarbejder med AI Blockchain Platform Talus Network for at låse op for Bitcoin-likviditet til AI
Forretning Nyheds rapport Teknologier
Ankr samarbejder med AI Blockchain Platform Talus Network for at låse op for Bitcoin-likviditet til AI
Maj 1, 2024
Binance Labs understøtter Movement Labs for at lette Facebooks Move-integration på tværs af blockchains
Forretning Nyheds rapport Teknologier
Binance Labs understøtter Movement Labs for at lette Facebooks Move-integration på tværs af blockchains
Maj 1, 2024
BRICS Nations Eye Stablecoin Trade Solution
Forretning Markeder Historier og anmeldelser Teknologier
BRICS Nations Eye Stablecoin Trade Solution
Maj 1, 2024
Bitcoin L2 Network BOB integreres med LayerZero for forbedret funktionalitet
Forretning Nyheds rapport Teknologier
Bitcoin L2 Network BOB integreres med LayerZero for forbedret funktionalitet
Maj 1, 2024