Nyhetsrapport Teknologi
Juni 23, 2023

Midjourney 5.2 och Stable Diffusion SDXL 0.9-uppdateringar för kreativ text-till-bild-generering

I korthet

StabilityAI har släppt den senaste modellen, Stable Diffusion SDXL 0.9, som lovar förbättrad uppfattning om prompter och förbättrade bilddetaljer.

Midjourney 5.2 introducerar nya funktioner som Outpainting, /shorten-kommando, anpassningsbara varianter och 1:1-bildtransformation.

Dessa uppdateringar förväntas förbättra användarupplevelsen och öka kreativiteten i den kreativa processen.

Idag släppte båda de stora text-till-bild-generatorerna betydande uppdateringar. Förbättrad noggrannhet vid generering av realistiska bilder från textbeskrivningar, såväl som nya funktioner som låter användare styra stilen och sammansättningen av de genererade bilderna.

Midjourney 5.2 och Stable Diffusion SDXL 0.9-uppdateringar för kreativ bildgenerering
Credit: Midjourney

Nya funktioner i Midjourney 5.2

Utöver StabilityAIs uppdateringar, Midjourney har också introducerat spännande funktioner i och med lanseringen av Midjourney 5.2. Ett anmärkningsvärt tillägg är funktionen Zooma ut, som liknar Adobes generativa fyllning för Photoshop. Det är dock viktigt att notera det MidjourneyZooma ut-funktionen involverar inte masker, och resultatet beror till stor del på omfattningen av parametern "göra ut".

Midjourney 5.2 ger en rad nya funktioner som förbättrar användarupplevelsen. Särskilt frisläppandet av Stable Diffusion XL 0.9 överskuggade den starka uppdateringen i Midjourney, som många användare från början förbisåg.

Några av de viktigaste funktionerna och förbättringarna i Midjourney 5.2:

  • Outpainting: Användare kan nu utforska Outpainting-funktionen med alternativ som 1.5, 2 och anpassade inställningar. När den används iterativt ger den här funktionen imponerande resultat.
  • Anpassningsbara varianter: Styrkan hos variationer i Midjourney är nu anpassningsbar. Användare kan enkelt växla mellan svaga och starka varianter genom att välja två knappar, vilket ger större flexibilitet i den kreativa processen.
  • 1:1 bildtransformation: Midjourney tillåter nu användare att omvandla vilken bild som helst till en kvadrat med ett bildförhållande på 1:1, vilket möjliggör sömlös integrering i olika sammanhang.

Också, Midjourney 5.2 har introducerat en ny funktion som kallas prompt parser, vilket gör det ännu lättare att generera imponerande bilder. Med kommandot "/förkorta [din prompt]" kan användare nu identifiera viktiga ord och eliminera onödiga, och optimera deras frågar för bästa resultat. Parsern tilldelar också vikter till varje ord, så att användare kan välja mellan fem alternativ för den mest lämpliga prompten. I enklare termer hjälper det att omvandla vaga idéer till en uppmaning som bättre överensstämmer med användarnas avsikter och behov.

När det gäller processkontroll, Midjourney har kommit ikapp konkurrensen. Men när det gäller användarvänlighet, Midjourney hamnar efter. De som söker bekvämlighet framför flexibilitet kan finna sig attraherad av adobe eldfluga, en rivaliserande plattform känd för sina användarvänliga funktioner. Å andra sidan, Stable Diffusion, med sin öppen källkod och tillägg, erbjuder oöverträffad flexibilitet. Trots StabilityAItillfälliga förseningar och tvetydiga uttalanden som "50 % utbildad" och "kommer att vara tillgängliga i mitten av juli, men det här är felaktigt", när vikterna blir tillgängliga kommer allt att passa smidigt.

Med dessa framsteg, Midjourney fortsätter att tillhandahålla spännande funktioner för enkel och effektiv bildgenerering. Användare kan nu få mer kontroll över sina meddelanden, vilket resulterar i bättre utdata. När tekniken fortsätter att utvecklas, plattformar som Midjourney syftar till att förbättra användarupplevelser och göra kreativa ansträngningar mer tillgängliga för alla.

Dessutom den senaste versionen av Midjourney betonar realism, särskilt märkbar i konstgenerering. För att lyfta fram dessa förbättringar gjordes en jämförelse mellan en prompt och en seed in Midjourney version 5.1 och 5.2.

Nyskapade exempel av Midjourney 5.2:

Nya funktioner i Stable Diffusion SDXL 0.9

StabilityAI har gjort förbättringar med lanseringen av sin senaste modell, Stable Diffusion SDXL 0.9. De lovar förbättrad uppfattning om prompter och förbättrad bilddetaljer, så att användare kan skapa mer fängslande bilder. Ännu bättre, du kan redan prova den nya modellen gratis på Klipp Drop.

Smakämnen Stable Diffusion SDXL 0.9-modellen har fått uppmärksamhet sedan den publicerades av StabilityAI. Även om den officiella bekräftelsen av releasen är tillgänglig, men länken har ännu inte tillhandahållits. I sin grundversion har SDXL 0.9-modellen imponerande 3.5 miljarder parametrar. Dessutom finns det planer på ytterligare en ensemble av två modeller, totalt anmärkningsvärda 6.6 miljarder parametrar.

För att uppnå förbättrad bildgenerering, StabilityAI använder en sammanlänkning av två CLIP-modeller: basklämman från OpenAI och OpenCLIP ViT-G/14. Denna sammansmältning möjliggör generering av mer exakta detaljer i bilderna. Parade bildjämförelser mellan SDXL beta och den nya versionen, SDXL 0.9, visar tydligt den avsevärda kvalitetsförbättringen.

Det är värt att notera att användning av SDXL 0.9-modellen under slutledning kräver ett grafikkort med minst 16 GB VRAM för att säkerställa smidig prestanda. Eftersom användare ivrigt väntar på ett omfattande blogginlägg med alla detaljer och släppandet av koden, finns det förväntan på ytterligare förbättringar och möjligheter.

Nyskapade exempel av SDXL 0.9:

Läs mer om AI:

Villkor

I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.

Om författaren

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

fler artiklar
Damir Yalalov
Damir Yalalov

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

Institutionell aptit växer mot Bitcoin ETFs mitt i volatilitet

Avslöjande genom 13F-anmälningar avslöjar anmärkningsvärda institutionella investerare som sysslar med Bitcoin ETF:er, vilket understryker en växande acceptans av ...

Lär dig mer

Straffdagen anländer: CZ:s öde hänger i balans när den amerikanska domstolen överväger DOJ:s vädjande

Changpeng Zhao är redo att dömas i en amerikansk domstol i Seattle i dag.

Lär dig mer
Gå med i vår innovativa teknikgemenskap
Läs mer
Läs mer
Donald Trumps övergång till krypto: från motståndare till förespråkare och vad det betyder för den amerikanska kryptovalutamarknaden
Företag Marknader Berättelser och recensioner Teknologi
Donald Trumps övergång till krypto: från motståndare till förespråkare och vad det betyder för den amerikanska kryptovalutamarknaden
Maj 10, 2024
Layer3 lanserar L3-token i sommar och allokerar 51 % av det totala utbudet till gemenskapen
Marknader Nyhetsrapport Teknologi
Layer3 lanserar L3-token i sommar och allokerar 51 % av det totala utbudet till gemenskapen
Maj 10, 2024
Edward Snowdens sista varning till Bitcoin-utvecklare: "Gör sekretess till en prioritet på protokollnivå eller riskera att förlora den
Marknader Säkerhet Wiki Mjukvara Berättelser och recensioner Teknologi
Edward Snowdens sista varning till Bitcoin-utvecklare: "Gör sekretess till en prioritet på protokollnivå eller riskera att förlora den
Maj 10, 2024
Optimismdrivet Ethereum Layer 2 Network Mint lanserar sitt huvudnät den 15 maj
Nyhetsrapport Teknologi
Optimismdrivet Ethereum Layer 2 Network Mint lanserar sitt huvudnät den 15 maj
Maj 10, 2024