Stability AI Släpper en ny modell som heter SDXL Beta
I korthet
Stability AI har släppt en ny modell som heter SDXL Beta (Stable Diffusion XL Beta). Det är en större modell med fler parametrar och några okända förbättringar. Den finns på DreamStudio, Stability AIs officiella bildgenerator, och använder avancerade algoritmer och djupinlärningstekniker för att skapa fantastiska bilder.
Stability AI har avslöjat en förhandstitt på en ny modell som heter SDXL Beta, förkortning för Stable Diffusion XL Beta. Hittills har företaget inte delat mycket information om modellen, men den finns tillgänglig för testning för alla som vill göra det. Vad är nytt med denna SDXL-modell för stable diffusion? Vilka är dess fördelar och nackdelar? Låt oss undersöka.
Vad är SDXL-modellen egentligen?
SDXL-modellen är en ny modell som är för närvarande utbildas. Den är långt ifrån färdig, och när den släpps kan många detaljer om den ändras; för allt vi vet kanske den inte ens heter SDXL-modellen. Allt vi vet är att det är en större modell med fler parametrar och några okända förbättringar. Det är en v2-modell, inte en v3-modell (vad det nu betyder). Det är möjligt att förbättringarna i v2-modellen skulle kunna förbättra systemets prestanda, men utan ytterligare information är det svårt att avgöra hur betydande dessa förbättringar kan vara. Dessutom skulle det vara bra att veta vilka specifika parametrar som har lagts till eller justerats i den här versionen.
SDXL-modellen är för närvarande tillgänglig på DreamStudio, Stability AIs officiella bildgenerator. Välj SDXL Beta från modellmenyn för att kolla in det. Det verkar använda avancerade algoritmer och tekniker för djupinlärning för att skapa fantastiska bilder som är perfekta för ett brett spektrum av applikationer.
Förbättringar
Läsbar text. SDXL kan generera läsbar text och det är förmodligen dess mest slående egenskap eftersom det inte var möjligt i de befintliga v1- och v2.1-modellerna. SDXLs genererade text är inte alltid korrekt som du kan se i Stable Diffusion Text nedan. Den är dock vida överlägsen v2.1, än mindre v1-modell. Detta beror på att SDXLs använder en mer avancerad algoritm för djupinlärning som gör att den kan förstå och generera mer komplexa språkstrukturer. Med vidareutveckling har den potential att bli ännu mer exakt och pålitlig.
Mänsklig anatomi. Den exakta genereringen av anatomiskt korrekta människofigurer har länge varit en utmaning för stable diffusion. Förekomsten av ytterligare eller saknade lemmar är vanligt. Inpainting används vanligtvis för att fixa dem, eller på senare tid kan du använda ControlNets Open Pose-funktion för att duplicera en pose från en referensbild. Vi är glada att notera att det är här som SDXL Beta-modellen har förbättrats. SDXL Beta-modellen har visat betydande förbättringar när det gäller att exakt duplicera poser från referensbilder. Detta kan vara ett värdefullt verktyg för olika applikationer som animation och virtuell verklighet.
Porträtt stil. SDXL Beta producerar utmärkta porträtt som ser ut som foton – det är en uppgradering jämfört med version 1.5. Den förbättrade algoritmen i SDXL Beta förbättrar detaljerna och färgnoggrannheten i porträtten, vilket resulterar i ett mer naturligt och realistiskt utseende. Användare kan också justera nivåerna av skärpa och mättnad för att uppnå önskade effekter.
Duotone. Nyckelordet duotone producerar alltid svartvita bilder i v1.5-modellen. Men nu kommer duotonebilderna som produceras av SDXL Beta i en mängd olika färger. Det är tydligt att jämfört med v1-modeller, förmågan att tolka uppmaningen har förbättrats, vilket resulterar i mer exakta och relevanta svar från v2-modellerna, vilket gör dem till ett mer tillförlitligt verktyg för bearbetningsuppgifter för naturligt språk.
Konstnärliga stilar. Det har gjorts några mindre justeringar, men det är svårt att avgöra om den nya modellen ger bättre resultat eftersom de helt enkelt är unika. Det är möjligt att dessa justeringar kan vara en fråga om personlig preferens eller subjektiv åsikt, vilket gör det svårt att göra en definativ bedömning av deras kvalitet. Ändå kan det unika med justeringarna vara anmärkningsvärt och värt att utforska ytterligare.
Slutsats
- Stable Diffusion äntligen kan producera text som är vettig.
- SDXL ger mer estetiskt tilltalande bilder än v2.1- och (i mindre utsträckning) v1.5-modellerna.
- Den nya modellen ger bilder som är mer exakta.
- Människans anatomi har förbättrats.
- Negativa uppmaningar är inte lika nödvändiga som i v2.1.
- Det kan skapa realistiska porträtt.
- Vissa konstigheter i modellen kommer att fixas innan release.
Läs fler relaterade artiklar:
Villkor
I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.
Om författaren
Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet.
fler artiklarDamir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet.