Stability AI Brengt een nieuw model uit genaamd SDXL Beta
In het kort
Stability AI heeft een nieuw model uitgebracht genaamd SDXL Beta (Stable Diffusion XL-bèta). Het is een groter model met meer parameters en enkele onbekende verbeteringen. Het is verkrijgbaar bij DreamStudio, Stability AI's officiële beeldgenerator, en maakt gebruik van geavanceerde algoritmen en deep learning-technieken om verbluffende beelden te creëren.
Stability AI heeft een preview onthuld van een nieuw model genaamd SDXL Beta, een afkorting van Stable Diffusion XL-bèta. Tot nu toe heeft het bedrijf niet veel informatie over het model gedeeld, maar het is beschikbaar om te testen voor iedereen die dat wil. Wat is er nieuw aan dit SDXL-model voor stable diffusion? Wat zijn de voor- en nadelen? Laten we het onderzoeken.
Lees verder: Midjourney en Dall-E Artist Styles Dump met voorbeelden: 130 beroemde AI-schildertechnieken |
Wat is het SDXL-model precies?
Het SDXL-model is een nieuw model dat momenteel is wordt getraind. Het is nog lang niet af en tegen de tijd dat het wordt uitgebracht, kunnen er veel details over veranderen; voor zover we weten, wordt het misschien niet eens het SDXL-model genoemd. Alles wat we weten is dat het een groter model is met meer parameters en enkele onbekende verbeteringen. Het is een v2-model, geen v3-model (wat dat ook betekent). Het is mogelijk dat de verbeteringen in het v2-model de prestaties van het systeem kunnen verbeteren, maar zonder verdere informatie is het moeilijk te bepalen hoe belangrijk deze verbeteringen kunnen zijn. Daarnaast is het handig om te weten welke specifieke parameters in deze versie zijn toegevoegd of aangepast.
Het SDXL-model is momenteel verkrijgbaar bij DreamStudio, Stability AI's officiële beeldgenerator. Selecteer SDXL Beta in het modelmenu om het te bekijken. Het lijkt geavanceerde algoritmen te gebruiken en diepe leertechnieken om verbluffende beelden te creëren die perfect zijn voor een breed scala aan toepassingen.
Verbeteringen
Leesbare tekst. SDXL is in staat om leesbare tekst te genereren en dit is waarschijnlijk het meest opvallende kenmerk, aangezien dit niet mogelijk was in de bestaande v1- en v2.1-modellen. De gegenereerde tekst van SDXL is niet altijd nauwkeurig, zoals u kunt zien in de Stable Diffusion Tekst hieronder. Het is echter veel beter dan v2.1, laat staan v1-model. Dit komt omdat SDXL's een geavanceerder deep learning-algoritme gebruikt waarmee het complexere taalstructuren kan begrijpen en genereren. Met verdere ontwikkeling heeft het de potentie om nog nauwkeuriger en betrouwbaarder te worden.
Menselijke anatomie. Het nauwkeurig genereren van anatomisch correcte menselijke figuren is al lang een uitdaging voor stable diffusion. De aanwezigheid van extra of ontbrekende ledematen is gebruikelijk. Inpainting wordt meestal gebruikt om ze te repareren, of, meer recentelijk, kunt u de Open Pose-functie van ControlNet gebruiken om een pose van een referentiebeeld te dupliceren. We zijn blij te zien dat hier het SDXL-bètamodel is verbeterd. Het SDXL Beta-model heeft een aanzienlijke verbetering laten zien in het nauwkeurig dupliceren van poses van referentiebeelden. Dit kan een waardevol hulpmiddel zijn voor verschillende toepassingen zoals animatie en virtual reality.
Portret stijl. SDXL Beta produceert uitstekende portretten die op foto's lijken - het is een upgrade ten opzichte van versie 1.5. Het verbeterde algoritme in SDXL Beta verbetert de details en kleurnauwkeurigheid van de portretten, wat resulteert in een natuurlijker en realistischer uiterlijk. Gebruikers kunnen ook de niveaus van scherpte en verzadiging aanpassen om de gewenste effecten te bereiken.
Duotoon. Het trefwoord duotone levert in het v1.5-model altijd zwart-witfoto's op. Nu zijn de duotone-afbeeldingen geproduceerd door SDXL Beta echter in verschillende kleuren verkrijgbaar. Het is duidelijk dat in vergelijking met v1-modellen de mogelijkheid om interpreteer de aanwijzing is verbeterd, wat resulteert in nauwkeurigere en relevantere antwoorden van de v2-modellen, waardoor ze een betrouwbaarder hulpmiddel zijn voor natuurlijke taalverwerkingstaken.
Artistieke stijlen. Er zijn wat kleine aanpassingen geweest, maar het is moeilijk vast te stellen of het nieuwe model betere resultaten oplevert, omdat ze simpelweg uniek zijn. Het is mogelijk dat deze aanpassingen een kwestie van persoonlijke voorkeur of subjectieve mening zijn, waardoor het moeilijk wordt om een defioordeel over hun kwaliteit. Desalniettemin kan het unieke karakter van de aanpassingen opmerkelijk zijn en de moeite waard om verder te onderzoeken.
Conclusie
- Stable Diffusion kan eindelijk tekst produceren die logisch is.
- SDXL biedt meer esthetisch aantrekkelijke beelden dan de v2.1 en (in mindere mate) de v1.5-modellen.
- Het nieuwe model produceert beelden die nauwkeuriger zijn.
- De menselijke anatomie is verbeterd.
- Negatieve prompts zijn niet zo noodzakelijk als in v2.1.
- Het kan realistische portretten maken.
- Sommige eigenaardigheden in het model zullen vóór de release worden opgelost.
Lees meer gerelateerde artikelen:
Disclaimer
In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.
Over de auteur
Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet.
Meer artikelenDamir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet.