Nyhetsrapport Teknologi
10 april 2023

Stability AI Släpper en ny modell som heter SDXL Beta

I korthet

Stability AI har släppt en ny modell som heter SDXL Beta (Stable Diffusion XL Beta). Det är en större modell med fler parametrar och några okända förbättringar. Den finns på DreamStudio, Stability AIs officiella bildgenerator, och använder avancerade algoritmer och djupinlärningstekniker för att skapa fantastiska bilder.

Stability AI har avslöjat en förhandstitt på en ny modell som heter SDXL Beta, förkortning för Stable Diffusion XL Beta. Hittills har företaget inte delat mycket information om modellen, men den finns tillgänglig för testning för alla som vill göra det. Vad är nytt med denna SDXL-modell för stable diffusion? Vilka är dess fördelar och nackdelar? Låt oss undersöka.

Läs mer: Midjourney och Dall-E Artist Styles Dump med exempel: 130 berömda AI-målningstekniker

Vad är SDXL-modellen egentligen?

SDXL-modellen är en ny modell som är för närvarande utbildas. Den är långt ifrån färdig, och när den släpps kan många detaljer om den ändras; för allt vi vet kanske den inte ens heter SDXL-modellen. Allt vi vet är att det är en större modell med fler parametrar och några okända förbättringar. Det är en v2-modell, inte en v3-modell (vad det nu betyder). Det är möjligt att förbättringarna i v2-modellen skulle kunna förbättra systemets prestanda, men utan ytterligare information är det svårt att avgöra hur betydande dessa förbättringar kan vara. Dessutom skulle det vara bra att veta vilka specifika parametrar som har lagts till eller justerats i den här versionen.

SDXL-modellen är för närvarande tillgänglig på DreamStudio, Stability AIs officiella bildgenerator. Välj SDXL Beta från modellmenyn för att kolla in det. Det verkar använda avancerade algoritmer och tekniker för djupinlärning för att skapa fantastiska bilder som är perfekta för ett brett spektrum av applikationer.

Vad är SDXL-modellen egentligen?

Förbättringar

Läsbar text. SDXL kan generera läsbar text och det är förmodligen dess mest slående egenskap eftersom det inte var möjligt i de befintliga v1- och v2.1-modellerna. SDXLs genererade text är inte alltid korrekt som du kan se i Stable Diffusion Text nedan. Den är dock vida överlägsen v2.1, än mindre v1-modell. Detta beror på att SDXLs använder en mer avancerad algoritm för djupinlärning som gör att den kan förstå och generera mer komplexa språkstrukturer. Med vidareutveckling har den potential att bli ännu mer exakt och pålitlig.

Uppmaning: foto av en gentleman som håller ett vitt papper som säger "No Fakes"
Uppmaning: foto av en gentleman som håller ett vitt papper som säger "No Fakes"
Foto av en rödhårig kvinna som håller i en svart skylt med vita typsnitt som säger "No Jokes"
Uppmaning: Foto av en rödhårig kvinna som håller en svart skylt med vita teckensnitt som säger "Inga skämt"
Uppmaning: Foto av en kinesisk kvinna som sitter på en biograf och håller en tallrik med ordet "Pain and Plane" skrivet på.
Uppmaning: Foto av en kinesisk kvinna som sitter på en biograf och håller en tallrik med ordet "Pain and Plane" skrivet på.

Mänsklig anatomi. Den exakta genereringen av anatomiskt korrekta människofigurer har länge varit en utmaning för stable diffusion. Förekomsten av ytterligare eller saknade lemmar är vanligt. Inpainting används vanligtvis för att fixa dem, eller på senare tid kan du använda ControlNets Open Pose-funktion för att duplicera en pose från en referensbild. Vi är glada att notera att det är här som SDXL Beta-modellen har förbättrats. SDXL Beta-modellen har visat betydande förbättringar när det gäller att exakt duplicera poser från referensbilder. Detta kan vara ett värdefullt verktyg för olika applikationer som animation och virtuell verklighet.

Foto av en kvinna i en sportoutfit som snurrar bollen i höger hand
Uppmaning: Foto av en kvinna i en sportoutfit som snurrar bollen i höger hand
Foto av en pojke som sitter under den röda månen
Uppmaning: Foto av en pojke som sitter under den röda månen
Uppmaning: Ett foto visar en gammal man springa i skogen.

Porträtt stil. SDXL Beta producerar utmärkta porträtt som ser ut som foton – det är en uppgradering jämfört med version 1.5. Den förbättrade algoritmen i SDXL Beta förbättrar detaljerna och färgnoggrannheten i porträtten, vilket resulterar i ett mer naturligt och realistiskt utseende. Användare kan också justera nivåerna av skärpa och mättnad för att uppnå önskade effekter.

Uppmaning: en bild på en pojke och flicka
Uppmaning: en bild på en pojke och flicka
Uppmaning: ett porträttfoto av en tjock kille
Uppmaning: ett porträttfoto av en tjock kille
Uppmaning: en bild på en kvinna från 80-talet
Uppmaning: en bild på en kvinna från 80-talet

Duotone. Nyckelordet duotone producerar alltid svartvita bilder i v1.5-modellen. Men nu kommer duotonebilderna som produceras av SDXL Beta i en mängd olika färger. Det är tydligt att jämfört med v1-modeller, förmågan att tolka uppmaningen har förbättrats, vilket resulterar i mer exakta och relevanta svar från v2-modellerna, vilket gör dem till ett mer tillförlitligt verktyg för bearbetningsuppgifter för naturligt språk.

duotone stil porträtt av en hund
Uppmaning: porträtt av en hund i duotone stil
duotone landskap av ön
Uppmaning: duotone landskap av ön
duotone porträtt av ung afrikansk kvinna
Uppmaning: duotone porträtt av ung afrikansk kvinna

Konstnärliga stilar. Det har gjorts några mindre justeringar, men det är svårt att avgöra om den nya modellen ger bättre resultat eftersom de helt enkelt är unika. Det är möjligt att dessa justeringar kan vara en fråga om personlig preferens eller subjektiv åsikt, vilket gör det svårt att göra en definativ bedömning av deras kvalitet. Ändå kan det unika med justeringarna vara anmärkningsvärt och värt att utforska ytterligare.

New York av Ivan Aivazovsky
v 1.5: New York av Ivan Aivazovsky
New York av Ivan Aivazovsky
SDXL: New York av Ivan Aivazovsky
Old Forest av Christopher Balaskas
v 1.5: Old Forest av Christopher Balaskas
Old Forest av Christopher Balaskas
SDXL: Old Forest av Christopher Balaskas

Slutsats

  • Stable Diffusion äntligen kan producera text som är vettig.
  • SDXL ger mer estetiskt tilltalande bilder än v2.1- och (i mindre utsträckning) v1.5-modellerna.
  • Den nya modellen ger bilder som är mer exakta.
  • Människans anatomi har förbättrats.
  • Negativa uppmaningar är inte lika nödvändiga som i v2.1.
  • Det kan skapa realistiska porträtt.
  • Vissa konstigheter i modellen kommer att fixas innan release.

Läs fler relaterade artiklar:

Villkor

I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.

Om författaren

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

fler artiklar
Damir Yalalov
Damir Yalalov

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

Hot Stories

BRICS Nations Eye Stablecoin Trade Solution

by Viktoriia Palchik
Maj 01, 2024
Gå med i vårt nyhetsbrev.
Senaste nytt

Straffdagen anländer: CZ:s öde hänger i balans när den amerikanska domstolen överväger DOJ:s vädjande

Changpeng Zhao är redo att dömas i en amerikansk domstol i Seattle i dag.

Lär dig mer

Samourai Wallet-grundare anklagade för att underlätta $2 miljarder i Darknet-erbjudanden

Uppfattningen av Samourai Wallet-grundarna representerar ett anmärkningsvärt bakslag för branschen, vilket understryker den ihållande ...

Lär dig mer
Gå med i vår innovativa teknikgemenskap
Läs mer
Läs mer
Ankr samarbetar med AI Blockchain Platform Talus Network för att låsa upp Bitcoin-likviditet för AI
Företag Nyhetsrapport Teknologi
Ankr samarbetar med AI Blockchain Platform Talus Network för att låsa upp Bitcoin-likviditet för AI
Maj 1, 2024
Binance Labs stödjer Movement Labs för att underlätta Facebooks Move-integration över blockkedjor
Företag Nyhetsrapport Teknologi
Binance Labs stödjer Movement Labs för att underlätta Facebooks Move-integration över blockkedjor
Maj 1, 2024
BRICS Nations Eye Stablecoin Trade Solution
Företag Marknader Berättelser och recensioner Teknologi
BRICS Nations Eye Stablecoin Trade Solution
Maj 1, 2024
Bitcoin L2 Network BOB integreras med LayerZero för förbättrad funktionalitet
Företag Nyhetsrapport Teknologi
Bitcoin L2 Network BOB integreras med LayerZero för förbättrad funktionalitet
Maj 1, 2024