Stability AI Frigiver en ny model kaldet SDXL Beta
Kort sagt
Stability AI har udgivet en ny model kaldet SDXL Beta (Stable Diffusion XL Beta). Det er en større model med flere parametre og nogle ukendte forbedringer. Den er tilgængelig på DreamStudio, Stability AI's officielle billedgenerator, og bruger avancerede algoritmer og dyb læringsteknikker til at skabe fantastiske billeder.
Stability AI har afsløret en forhåndsvisning af en ny model kaldet SDXL Beta, en forkortelse for Stable Diffusion XL Beta. Indtil videre har virksomheden ikke delt meget information om modellen, men den er tilgængelig til test for alle, der ønsker at gøre det. Hvad er nyt ved denne SDXL-model til stable diffusion? Hvad er dens fordele og ulemper? Lad os undersøge det.
Hvad er SDXL-modellen helt præcist?
SDXL-modellen er en ny model, der pt bliver trænet. Den er langt fra færdig, og inden den udkommer, kan en masse detaljer om den ændre sig; for alt hvad vi ved, kaldes den måske ikke engang SDXL-modellen. Det eneste vi ved er, at det er en større model med flere parametre og nogle ukendte forbedringer. Det er en v2-model, ikke en v3-model (hvad det så end betyder). Det er muligt, at forbedringerne i v2-modellen kunne forbedre systemets ydeevne, men uden yderligere information er det svært at afgøre, hvor væsentlige disse forbedringer kan være. Derudover ville det være nyttigt at vide, hvilke specifikke parametre der er blevet tilføjet eller justeret i denne version.
SDXL-modellen er i øjeblikket tilgængelig på DreamStudio, Stability AI's officielle billedgenerator. Vælg SDXL Beta fra modelmenuen for at tjekke det ud. Det ser ud til at bruge avancerede algoritmer og deep learning teknikker at skabe fantastiske billeder, der er perfekte til en lang række applikationer.
Forbedringer
Læselig tekst. SDXL er i stand til at generere læselig tekst, og det er nok dens mest slående egenskab, da det ikke var muligt i de eksisterende v1 og v2.1 modeller. SDXL's genererede tekst er ikke altid nøjagtig, som du kan se i Stable Diffusion Tekst nedenfor. Den er dog langt overlegen i forhold til v2.1, endsige v1-modellen. Dette skyldes, at SDXL'er bruger en mere avanceret deep learning-algoritme, der gør det muligt at forstå og generere mere komplekse sprogstrukturer. Med yderligere udvikling har den potentiale til at blive endnu mere præcis og pålidelig.
Menneskets anatomi. Den nøjagtige generering af anatomisk korrekte menneskefigurer har længe været en udfordring for stable diffusion. Tilstedeværelsen af yderligere eller manglende lemmer er almindelig. Inpainting bruges typisk til at rette dem, eller for nylig kan du bruge ControlNets Open Pose-funktion til at duplikere en positur fra et referencebillede. Vi er glade for at bemærke, at det er her, SDXL Beta-modellen er blevet forbedret. SDXL Beta-modellen har vist betydelige forbedringer i nøjagtigt at kopiere positurer fra referencebilleder. Dette kan være et værdifuldt værktøj til forskellige applikationer såsom animation og virtual reality.
Portræt stil. SDXL Beta producerer fremragende portrætter, der ligner billeder – det er en opgradering i forhold til version 1.5. Den forbedrede algoritme i SDXL Beta forbedrer detaljerne og farvenøjagtigheden af portrætterne, hvilket resulterer i et mere naturligt og realistisk udseende. Brugere kan også justere niveauerne af skarphed og mætning for at opnå deres ønskede effekter.
Duotone. Nøgleordet duotone producerer altid sort-hvide fotos i v1.5-modellen. Men nu kommer duotone-billederne produceret af SDXL Beta i en række forskellige farver. Det er klart, at i forhold til v1-modeller, er evnen til fortolke prompten er blevet forbedret, hvilket resulterer i mere præcise og relevante svar fra v2-modellerne, hvilket gør dem til et mere pålideligt værktøj til behandling af naturlige sprog.
Kunstneriske stilarter. Der har været nogle mindre justeringer, men det er svært at afgøre, om den nye model giver bedre resultater, da de simpelthen er unikke. Det er muligt, at disse justeringer kan være et spørgsmål om personlig præference eller subjektiv mening, hvilket gør det vanskeligt at foretage en definiv bedømmelse af deres kvalitet. Ikke desto mindre kan det unikke ved justeringerne være bemærkelsesværdigt og værd at undersøge nærmere.
Konklusion
- Stable Diffusion endelig kan producere tekst, der giver mening.
- SDXL giver mere æstetisk tiltalende billeder end v2.1- og (i mindre grad) v1.5-modellerne.
- Den nye model producerer billeder, der er mere nøjagtige.
- Menneskets anatomi er blevet forbedret.
- Negative prompter er ikke så nødvendige som i v2.1.
- Det kan skabe realistiske portrætter.
- Nogle mærkværdigheder i modellen vil blive rettet inden udgivelsen.
Læs flere relaterede artikler:
Ansvarsfraskrivelse
I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.
Om forfatteren
Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.
Flere artiklerDamir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.