Nyhetsrapport Teknologi
Juli 27, 2023

Stability AI Lanserar Stable Diffusion XL 1.0 för att snabbt producera 1-megapixelbilder

I korthet

Stability AI har släppt sin senaste produkt, SDXL 1.0, ett verktyg för text-till-bild-generering med förbättrad bildkvalitet och ett användarvänligt gränssnitt.

Med 3.5 miljarder parametrar kan den producera 1-megapixelbilder i olika bildförhållanden.

Modellen är designad för att effektivisera text-till-bild generationsprocessen och inkluderar finjusteringsfunktioner, såsom ControlNet, som härrör från Stanford University-forskning.

SDXL 1.0 är optimerad för konsument-GPU:er med en 8GB VRAM-kapacitet och är lika effektiv på rimligt prissatta molninstanser.

Mjukvaran erbjuder förbättrad finjustering, vilket möjliggör generering av Custom LoRA eller checkpoints med minskad dataoverhead.

AI-gemenskapen kan förvänta sig uppdateringar inom en snar framtid, och SDXL 1.0 kan generera avancerade koncept, såsom intrikata detaljer eller komplexa rumsliga kompositioner.

Verktyget är tillgängligt med öppen källkod på GitHub, vilket främjar transparens och samarbete inom gemenskapen.

Stable Diffusion XL 1.0 (SDXL 1.0), den senaste produkten från Stability AI, har äntligen släppts. Detta verktyg, som är positionerat som den senaste utvecklingen inom text-till-bild-generering, utmärker sig för sin förbättrade bildkvalitet och användarvänliga gränssnitt.

Stability AI Lanserar Stable Diffusion XL 1.0 för att snabbt producera 1-megapixelbilder
Kredit: stabilitet.ai
Relaterad: NVIDIA-aktien stiger med 26 % efter starka resultat under första kvartalet ledd av växande efterfrågan på AI GPU:er

Medan många i AI-branschen fortsätter att förbättra sina plattformar, Stability AIDen senaste versionen av SDXL 1.0 visar ett lovande framsteg. Modellens imponerande 3.5 miljarder parametrar gör att den snabbt kan producera 1-megapixelbilder i olika bildförhållanden. Joe Penna, chef för tillämpad maskininlärning vid Stability AI, betonade modellens möjligheter i ett samtal med TechCrunch. Han betonade hur det kan anpassas och hur du kan justera bildkoncept och stilar genom att använda grundläggande naturliga språkbehandlingssignaler. Med hjälp av dessa funktioner kan användarnas uppgifter göras enklare samtidigt som du följer tydliga instruktioner för att skapa komplexa designs.

Stability AI verkar ha tagit itu med utmaningar som är vanliga inom AI-sektorn, särskilt när det gäller textgenerering. Anmärkningsvärt är att många banbrytande text-till-bild-modeller ofta kommer till korta när de har till uppgift att generera läsbar text, särskilt i intrikata stilar som kalligrafi. SDXL 1.0 har dock visat upp kunskaper i avancerad textgenerering.

Det som ytterligare skiljer SDXL 1.0 är dess konkurrensposition mot andra stora utmanare som t.ex Midjourney och Adobes Firefly service. Den nya modellen understryker förbättrade bildförfiningsprocesser, vilket resulterar i rikare färger, överlägsen belysning och förbättrad kontrast. Dessutom underlättar införandet av en finjusteringsfunktion genereringen av skräddarsydda bilder.

Utvecklingen av SDXL 1.0 utnyttjade en strömlinjeformad träningsmetod som drar nytta av dess stora parameterbas, vilket positionerar den som en idealisk grund för olika verktyg och möjligheter. Emad Mostaque, VD för, utvecklar dess egenskaper Stability AI, uppgav att SDXL 1.0 var noggrant utformad för att effektivisera text-till-bild generering bearbeta. Detta har berikats ytterligare med ControlNet, som kommer från Stanford Universitys forskning, vilket underlättar förbättrade finjusterings- och kompositionsmöjligheter.

En anmärkningsvärd egenskap hos SDXL 1.0-modellen är dess användarcentrerade design. I motsats till att kräva långa uppmaningar för att ge önskvärda resultat, tillåter modellen användare att utfärda komplexa direktiv i flera delar, som kortfattat fångar avsikten med färre ord än tidigare modeller. Från och med nu är denna innovativa modell tillgänglig via flera plattformar, inklusive tjänsterna Amazon Bedrock och Amazon SageMaker Jumpstart.

Förbättrad prestanda på konsument-GPU:er och avancerade finjusteringsfunktioner

SDXL 1.0 genererad bild
SDXL 1.0 genererad bild
Relaterad: Stability AI höjer 101 miljoner dollar, stänger värderingen på 1 miljard dollar

Designad med kompatibilitet i åtanke, SDXL 1.0 är optimerad för konsument-GPU:er med en 8GB VRAM-kapacitet och är lika effektiv på rimligt prissatta molninstanser.

Funktioner och kompatibilitet:

Lanseringen av SDXL 1.0 visar Stabilitys engagemang för att säkerställa effektiva och tillgängliga AI-lösningar för användare. En av de viktigaste aspekterna av tillkännagivandet är programvarans förmåga att fungera sömlöst på vanliga konsument-GPU:er. För användarna innebär detta potentialen för optimal prestanda utan behov av avancerad eller specialiserad hårdvara.

Förbättringar i finjustering:

Stabilitet har inkorporerat funktioner i SDXL 1.0 som förenklar processen med modellomskolning för unika datamängder. Den nuvarande modellen tillåter generering av Custom LoRA eller checkpoints med minskad dataoverhead, vilket banar väg för effektivare och snabbare modellanpassningar till specifika behov. Dessutom finns det en antydan mot framtiden som Stability AI teamet är mitt uppe i utvecklingen av avancerade kontroller för uppgiftsspecifika strukturer, stilar och kompositioner. Närmare bestämt är T2I/ControlNet, som är specialiserat för SDXL, vid horisonten. Även om dessa framsteg förblir i pre-beta-fasen, kan AI-gemenskapen och användare förutse uppdateringar inom en snar framtid.

Rendera avancerade koncept:

SDXL 1.0 visar upp sin förmåga att generera koncept som tidigare var utmanande för bildmodeller. Detta inkluderar att återge intrikata detaljer som händer och text, eller till och med mer komplexa rumsliga kompositioner, som scener som visar en kvinna i bakgrunden som jagar en hund i förgrunden. Denna funktion är särskilt betydelsefull eftersom den indikerar ett språng i programvarans förmåga att tolka och återge nyanserade och mångfacetterade scenarier.

Tillgänglighet med öppen källkod:

För utvecklare och entusiaster som är intresserade av att gräva djupare har Stability gjort vikterna och koden för SDXL 1.0 tillgängliga på GitHub. Detta drag främjar inte bara transparens utan uppmuntrar också samarbetsutveckling och innovation inom samhället.

Testa:

För de som är ivriga att testa funktionerna i SDXL 1.0 har Stability integrerat det i plattformar som DreamStudio och ClipDrop. Dessutom är interaktiva sessioner och potentiella demonstrationer tillgängliga via Discord, vilket gör att användare kan uppleva verktygets funktioner från första hand.

Läs mer om AI:

Villkor

I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.

Om författaren

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

fler artiklar
Damir Yalalov
Damir Yalalov

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

From Ripple to The Big Green DAO: How Cryptocurrency Projects Contribute to Charity

Låt oss utforska initiativ som utnyttjar potentialen hos digitala valutor för välgörande ändamål.

Lär dig mer

AlphaFold 3, Med-Gemini och andra: The Way AI Transforms Healthcare in 2024

AI manifesterar sig på olika sätt inom vården, från att avslöja nya genetiska korrelationer till att stärka robotkirurgiska system ...

Lär dig mer
Gå med i vår innovativa teknikgemenskap
Läs mer
Läs mer
Topp 10 gratis AI-verktyg för att skapa innehåll, videoredigering och mer
AI Wiki Smälta Utbildning Livsstil Mjukvara Teknologi
Topp 10 gratis AI-verktyg för att skapa innehåll, videoredigering och mer
Maj 14, 2024
Hong Kong Securities Commission varnar för Deepfake-bedrägerier som riktar sig till kryptoindustrin: konsekvenser för investerares säkerhet
Livsstil Säkerhet Wiki Mjukvara Berättelser och recensioner Teknologi
Hong Kong Securities Commission varnar för Deepfake-bedrägerier som riktar sig till kryptoindustrin: konsekvenser för investerares säkerhet
Maj 14, 2024
Ripple och Evmos samarbetar för att utveckla XRP Ledger EVM Sidechain med EvmOS-teknik
Företag Nyhetsrapport Teknologi
Ripple och Evmos samarbetar för att utveckla XRP Ledger EVM Sidechain med EvmOS-teknik
Maj 14, 2024
5ireChain initierar stimulerande 'Testnet Thunder: GA' för nätverksstresstestning, inbjuder användare att delta i Airdrop Belöningar
Nyhetsrapport Teknologi
5ireChain initierar stimulerande 'Testnet Thunder: GA' för nätverksstresstestning, inbjuder användare att delta i Airdrop Belöningar
Maj 14, 2024