Nyheds rapport Teknologier
23. Juni, 2023

Midjourney 5.2 og Stable Diffusion SDXL 0.9-opdateringer til kreativ tekst-til-billede-generering

Kort sagt

StabilityAI har udgivet den nyeste model, Stable Diffusion SDXL 0.9, som lover forbedret opfattelse af prompter og forbedrede billeddetaljer.

Midjourney 5.2 introducerer nye funktioner som Outpainting, /shorten-kommando, tilpassede variationer og 1:1 billedtransformation.

Disse opdateringer forventes at forbedre brugeroplevelsen og øge kreativiteten i den kreative proces.

I dag udgav begge de store tekst-til-billede-generatorer betydelige opdateringer. Forbedret nøjagtighed ved generering af realistiske billeder ud fra tekstbeskrivelser samt nye funktioner, der giver brugerne mulighed for at kontrollere stilen og sammensætningen af ​​de genererede billeder.

Midjourney 5.2 og Stable Diffusion SDXL 0.9-opdateringer til kreativ billedgenerering
Credit: Midjourney

Nye funktioner i Midjourney 5.2

Foruden StabilityAIs opdateringer, Midjourney har også introduceret spændende funktioner med udgivelsen af Midjourney 5.2. En bemærkelsesværdig tilføjelse er Zoom Out-funktionen, som ligner Adobes Generative Fill til Photoshop. Det er dog vigtigt at bemærke det Midjourney's Zoom Out-funktion involverer ikke masker, og resultatet afhænger i høj grad af omfanget af "do Out"-parameteren.

Midjourney 5.2 bringer en række nye funktioner, der forbedrer brugeroplevelsen. Især udgivelsen af Stable Diffusion XL 0.9 overskyggede den stærke opdatering i Midjourney, som mange brugere i første omgang overså.

Nogle af de vigtigste funktioner og forbedringer i Midjourney 5.2:

  • Outpainting: Brugere kan nu udforske Outpainting-funktionen med muligheder som 1.5, 2 og brugerdefinerede indstillinger. Når den bruges iterativt, giver denne funktion imponerende resultater.
  • Tilpasselige variationer: Styrken af ​​variationer i Midjourney kan nu tilpasses. Brugere kan nemt skifte mellem svage og stærke variationer ved at vælge to knapper, hvilket giver større fleksibilitet i den kreative proces.
  • 1:1 billedtransformation: Midjourney giver nu brugerne mulighed for at transformere ethvert billede til en firkant med et billedformat på 1:1, hvilket muliggør problemfri integration i forskellige sammenhænge.

Således, Midjourney 5.2 har introduceret en ny funktion kaldet prompt-parseren, der gør det endnu nemmere at generere imponerende billeder. Med kommandoen "/forkorte [din prompt]" kan brugere nu identificere vigtige ord og eliminere unødvendige, og optimere deres anmoder om de bedste resultater. Parseren tildeler også vægte til hvert ord, så brugerne kan vælge mellem fem muligheder for den bedst egnede prompt. I enklere vendinger hjælper det med at transformere vage ideer til en prompt, der bedre stemmer overens med brugernes hensigter og behov.

Når det kommer til processtyring, Midjourney har indhentet konkurrencen. Men med hensyn til brugervenlighed, Midjourney falder bagud. De, der søger bekvemmelighed frem for fleksibilitet, kan blive tiltrukket af adobe ildflue, en rivaliserende platform kendt for sine brugervenlige funktioner. På den anden side, Stable Diffusion, med sin open source karakter og udvidelser, tilbyder enestående fleksibilitet. På trods af StabilityAIs lejlighedsvise forsinkelser og tvetydige udtalelser som "50% trænet" og "vil være tilgængelige i midten af ​​juli, men dette er unøjagtigt," når vægtene bliver tilgængelige, vil alt justeres glat.

Med disse fremskridt, Midjourney fortsætter med at levere spændende funktioner til nem og effektiv billedgenerering. Brugere kan nu nyde mere kontrol over deres prompter, hvilket resulterer i bedre output. I takt med at teknologien fortsætter med at udvikle sig, f.eks Midjourney sigter mod at forbedre brugeroplevelsen og gøre kreative bestræbelser mere tilgængelige for alle.

Desuden den seneste version af Midjourney understreger realisme, især mærkbar i kunstgenerering. For at fremhæve disse forbedringer blev der foretaget en sammenligning mellem en prompt og en frø ind Midjourney version 5.1 og 5.2.

Frisk genererede eksempler af Midjourney 5.2:

Nye funktioner i Stable Diffusion SDXL 0.9

StabilityAI har foretaget forbedringer med udgivelsen af ​​deres seneste model, Stable Diffusion SDXL 0.9. De lover øget opfattelse af prompter og forbedrede billeddetaljer, så brugerne kan skabe mere fængslende billeder. Endnu bedre, du kan allerede prøve den nye model gratis på Klip Drop.

Stable Diffusion SDXL 0.9-modellen har fået opmærksomhed siden den blev udgivet af StabilityAI. Selvom den officielle bekræftelse af udgivelsen er tilgængelig, men linket er endnu ikke givet. I sin basisversion kan SDXL 0.9-modellen prale af imponerende 3.5 Bln-parametre. Derudover er der planer om endnu et ensemble af to modeller, med i alt bemærkelsesværdige 6.6 milliarder parametre.

For at opnå forbedret billedgenerering, StabilityAI anvender en sammenkædning af to CLIP-modeller: basisklemmen fra OpenAI og OpenCLIP ViT-G/14. Denne sammensmeltning giver mulighed for generering af mere nøjagtige detaljer i billederne. Parrede billedsammenligninger mellem SDXL beta og den nye version, SDXL 0.9, viser tydeligt den væsentlige kvalitetsforbedring.

Det er værd at bemærke, at brug af SDXL 0.9-modellen under inferens kræver et videokort med mindst 16 GB VRAM for at sikre jævn ydeevne. Da brugere spændt venter på et omfattende blogindlæg med alle detaljer og frigivelsen af ​​koden, er der forventning om yderligere forbedringer og muligheder.

Frisk genererede eksempler af SDXL 0.9:

Læs mere om AI:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Hot Stories
Tilmeld dig vores nyhedsbrev.
Seneste Nyheder

Institutionel appetit vokser mod Bitcoin ETF'er midt i volatilitet

Afsløringer gennem 13F-arkivering afslører bemærkelsesværdige institutionelle investorer, der dytter i Bitcoin ETF'er, hvilket understreger en voksende accept af ...

Vide mere

Straffeudmålingsdagen ankommer: CZ's skæbne hænger i balance, da amerikansk domstol overvejer DOJ's anbringende

Changpeng Zhao står klar til at blive dømt ved en amerikansk domstol i Seattle i dag.

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
Donald Trumps skift til krypto: Fra modstander til advokat, og hvad det betyder for det amerikanske kryptovalutamarked
Forretning Markeder Historier og anmeldelser Teknologier
Donald Trumps skift til krypto: Fra modstander til advokat, og hvad det betyder for det amerikanske kryptovalutamarked
Maj 10, 2024
Layer3 lancerer L3-token denne sommer, og allokerer 51 % af det samlede udbud til Fællesskabet
Markeder Nyheds rapport Teknologier
Layer3 lancerer L3-token denne sommer, og allokerer 51 % af det samlede udbud til Fællesskabet
Maj 10, 2024
Edward Snowdens sidste advarsel til Bitcoin-udviklere: "Gør privatlivets fred til en prioritet på protokolniveau eller risiko for at miste det
Markeder Sikkerhed Wiki Software Historier og anmeldelser Teknologier
Edward Snowdens sidste advarsel til Bitcoin-udviklere: "Gør privatlivets fred til en prioritet på protokolniveau eller risiko for at miste det
Maj 10, 2024
Optimismedrevet Ethereum Layer 2 Network Mint lancerer sit hovednet den 15. maj
Nyheds rapport Teknologier
Optimismedrevet Ethereum Layer 2 Network Mint lancerer sit hovednet den 15. maj
Maj 10, 2024