Stability AI Veröffentlichung eines neuen Modells namens SDXL Beta
In Kürze
Stability AI hat ein neues Modell namens SDXL Beta veröffentlicht (Stable Diffusion XL Beta). Es handelt sich um ein größeres Modell mit mehr Parametern und einigen unbekannten Verbesserungen. Es ist bei DreamStudio erhältlich. Stability AIist der offizielle Bildgenerator und nutzt fortschrittliche Algorithmen und Deep-Learning-Techniken, um atemberaubende Bilder zu erstellen.
Stability AI hat eine Vorschau auf ein neues Modell namens SDXL Beta vorgestellt, kurz für Stable Diffusion XL-Beta. Bisher hat das Unternehmen nicht viele Informationen über das Modell preisgegeben, es steht aber jedem, der es möchte, zum Testen zur Verfügung. Was ist das Neue an diesem SDXL-Modell? stable diffusion? Was sind seine Vor- und Nachteile? Lassen Sie uns untersuchen.
Was genau ist das SDXL-Modell?
Das SDXL-Modell ist ein neues Modell, das derzeit erhältlich ist trainiert werden. Es ist noch lange nicht fertig, und bis es veröffentlicht wird, können sich viele Details darüber ändern; Soweit wir wissen, wird es möglicherweise nicht einmal als SDXL-Modell bezeichnet. Wir wissen nur, dass es sich um ein größeres Modell mit mehr Parametern und einigen unbekannten Verbesserungen handelt. Es ist ein v2-Modell, kein v3-Modell (was auch immer das bedeutet). Es ist möglich, dass die Verbesserungen im v2-Modell die Systemleistung verbessern, aber ohne weitere Informationen ist es schwierig zu bestimmen, wie signifikant diese Verbesserungen sind. Außerdem wäre es hilfreich zu wissen, welche spezifischen Parameter in dieser Version hinzugefügt oder angepasst wurden.
Das SDXL-Modell ist derzeit bei DreamStudio erhältlich. Stability AIist der offizielle Bildgenerator. Wählen Sie im Modellmenü SDXL Beta aus, um es auszuprobieren. Es scheint fortschrittliche Algorithmen zu verwenden und Deep-Learning-Techniken um atemberaubende Bilder zu erstellen, die sich perfekt für eine Vielzahl von Anwendungen eignen.
Verbesserungen
Lesbarer Text. SDXL ist in der Lage, lesbaren Text zu generieren, und dies ist wahrscheinlich das auffälligste Merkmal, da dies in den vorhandenen Modellen v1 und v2.1 nicht möglich war. Der von SDXL generierte Text ist nicht immer korrekt, wie Sie im sehen können Stable Diffusion Text unten. Allerdings ist es der Version 2.1 weit überlegen, ganz zu schweigen vom Modell der Version 1. Dies liegt daran, dass SDXLs einen fortschrittlicheren Deep-Learning-Algorithmus verwendet, der es ihm ermöglicht, komplexere Sprachstrukturen zu verstehen und zu generieren. Mit der Weiterentwicklung besteht das Potenzial, noch genauer und zuverlässiger zu werden.
Menschliche Anatomie. Die genaue Generierung anatomisch korrekter menschlicher Figuren ist seit langem eine Herausforderung für stable diffusion. Das Vorhandensein zusätzlicher oder fehlender Gliedmaßen ist üblich. Inpainting wird normalerweise verwendet, um sie zu beheben, oder Sie können neuerdings die Open Pose-Funktion von ControlNet verwenden, um eine Pose aus einem Referenzbild zu duplizieren. Wir freuen uns, dass sich das SDXL Beta-Modell hier verbessert hat. Das SDXL Beta-Modell hat eine signifikante Verbesserung beim genauen Duplizieren von Posen aus Referenzbildern gezeigt. Dies kann ein wertvolles Werkzeug für verschiedene Anwendungen wie Animation und virtuelle Realität sein.
Porträtstil. SDXL Beta produziert hervorragende Porträts, die wie Fotos aussehen – es ist ein Upgrade im Vergleich zu Version 1.5. Der verbesserte Algorithmus in SDXL Beta verbessert die Details und die Farbgenauigkeit der Porträts, was zu einem natürlicheren und realistischeren Aussehen führt. Benutzer können auch die Schärfe- und Sättigungsstufen anpassen, um die gewünschten Effekte zu erzielen.
Zweifarbig. Das Schlüsselwort duotone erzeugt im v1.5-Modell immer Schwarzweißfotos. Mittlerweile sind die von SDXL Beta erzeugten Duotone-Bilder jedoch in verschiedenen Farben erhältlich. Es ist klar, dass im Vergleich zu V1-Modellen die Möglichkeit dazu besteht Interpretieren Sie die Aufforderung hat sich verbessert, was zu genaueren und relevanteren Antworten der v2-Modelle führt und sie zu einem zuverlässigeren Werkzeug für Aufgaben der Verarbeitung natürlicher Sprache macht.
Künstlerische Stile. Es gab einige kleinere Anpassungen, aber es ist schwierig zu sagen, ob das neue Modell bessere Ergebnisse liefert, da sie einfach einzigartig sind. Es ist möglich, dass diese Anpassungen eine Frage persönlicher Vorlieben oder subjektiver Meinungen sind, was es schwierig macht, eine vorzunehmen defipositives Urteil über ihre Qualität. Dennoch ist die Einzigartigkeit der Anpassungen möglicherweise bemerkenswert und es lohnt sich, sie weiter zu untersuchen.
Zusammenfassung
- Stable Diffusion endlich einen sinnvollen Text produzieren kann.
- SDXL bietet ästhetisch ansprechendere Bilder als die v2.1- und (in geringerem Maße) die v1.5-Modelle.
- Das neue Modell erzeugt genauere Bilder.
- Die menschliche Anatomie hat sich verbessert.
- Negative Eingabeaufforderungen sind nicht so notwendig wie in v2.1.
- Es kann realistische Porträts erstellen.
- Einige Kuriositäten im Modell werden vor der Veröffentlichung behoben.
Lesen Sie weitere verwandte Artikel:
Haftungsausschluss
Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.
Über den Autor
Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein.
Weitere ArtikelDamir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein.