Stability AI Wypuszcza nowy model o nazwie SDXL Beta
W skrócie
Stability AI wydała nowy model o nazwie SDXL Beta (Stable Diffusion XLBeta). Jest to większy model z większą liczbą parametrów i kilkoma nieznanymi ulepszeniami. Jest dostępny w DreamStudio, Stability AIjest oficjalnym generatorem obrazów i wykorzystuje zaawansowane algorytmy oraz techniki głębokiego uczenia się do tworzenia oszałamiających efektów wizualnych.
Stability AI zaprezentowała zapowiedź nowego modelu o nazwie SDXL Beta, skrót od Stable Diffusion Wersja XL Beta. Na razie firma nie podzieliła się zbyt wieloma informacjami na temat modelu, ale jest on dostępny do testów dla każdego, kto ma na to ochotę. Co jest nowatorskiego w tym modelu SDXL stable diffusion? Jakie są jego zalety i wady? Zbadajmy.
Czytaj więcej: Midjourney i Dall-E Artist Styles zrzut z przykładami: 130 słynnych technik malarskich AI |
Czym dokładnie jest model SDXL?
Model SDXL to obecnie nowy model być szkolonym. Jest daleki od ukończenia, a do czasu jego wydania wiele szczegółów na jego temat może ulec zmianie; z tego, co wiemy, może nawet nie nazywać się modelem SDXL. Wiemy tylko, że jest to większy model z większą liczbą parametrów i kilkoma nieznanymi ulepszeniami. Jest to model v2, a nie model v3 (cokolwiek to znaczy). Możliwe, że ulepszenia w modelu v2 mogłyby poprawić wydajność systemu, ale bez dodatkowych informacji trudno jest określić, jak znaczące mogą być te ulepszenia. Dodatkowo przydałaby się informacja, jakie konkretne parametry zostały dodane lub dostosowane w tej wersji.
Model SDXL jest obecnie dostępny w DreamStudio, Stability AIoficjalny generator obrazów. Wybierz SDXL Beta z menu modelu, aby to sprawdzić. Wydaje się, że używa zaawansowanych algorytmów i techniki głębokiego uczenia się do tworzenia oszałamiających efektów wizualnych, które są idealne do szerokiego zakresu zastosowań.
Ulepszenia
Czytelny tekst. SDXL jest w stanie generować czytelny tekst i jest to prawdopodobnie jego najbardziej uderzająca cecha, ponieważ nie było to możliwe w istniejących modelach v1 i v2.1. Wygenerowany tekst SDXL nie zawsze jest dokładny, jak widać w pliku Stable Diffusion Tekst poniżej. Jest jednak znacznie lepszy od wersji 2.1, nie mówiąc już o modelu v1. Dzieje się tak, ponieważ SDXLs wykorzystuje bardziej zaawansowany algorytm głębokiego uczenia się, który pozwala mu rozumieć i generować bardziej złożone struktury językowe. Dzięki dalszemu rozwojowi może stać się jeszcze dokładniejszy i bardziej niezawodny.
Anatomia człowieka. Dokładne generowanie anatomicznie poprawnych postaci ludzkich od dawna stanowi wyzwanie stable diffusion. Obecność dodatkowych lub brakujących kończyn jest powszechna. Malowanie jest zwykle używane do ich naprawiania, a ostatnio możesz użyć funkcji Open Pose ControlNet, aby powielić pozę z obrazu referencyjnego. Cieszymy się, że w tym miejscu model SDXL Beta uległ poprawie. Model SDXL Beta wykazał znaczną poprawę w dokładnym powielaniu póz z obrazów referencyjnych. Może to być cenne narzędzie do różnych zastosowań, takich jak animacja i wirtualna rzeczywistość.
Styl portretowy. SDXL Beta tworzy doskonałe portrety, które wyglądają jak zdjęcia – to ulepszenie w stosunku do wersji 1.5. Udoskonalony algorytm SDXL Beta zwiększa szczegółowość i dokładność kolorów portretów, zapewniając bardziej naturalny i realistyczny wygląd. Użytkownicy mogą również dostosować poziomy ostrości i nasycenia, aby osiągnąć pożądane efekty.
dwutonowy. Słowo kluczowe duotone zawsze tworzy czarno-białe zdjęcia w modelu v1.5. Jednak teraz obrazy bichromii tworzone przez SDXL Beta są dostępne w różnych kolorach. Oczywiste jest, że w porównaniu z modelami v1, zdolność do zinterpretować monit uległa poprawie, co skutkuje dokładniejszymi i trafniejszymi odpowiedziami z modeli v2, czyniąc je bardziej niezawodnym narzędziem do zadań związanych z przetwarzaniem języka naturalnego.
Style artystyczne. Wprowadzono kilka drobnych poprawek, ale trudno stwierdzić, czy nowy model zapewnia lepsze wyniki, ponieważ są one po prostu unikalne. Możliwe, że te korekty mogą być kwestią osobistych preferencji lub subiektywnej opinii, co utrudnia dokonanie defiwyraźną ocenę ich jakości. Niemniej jednak wyjątkowość dostosowań może być godna uwagi i warta dalszego zbadania.
Wnioski
- Stable Diffusion może w końcu stworzyć tekst, który ma sens.
- SDXL zapewnia bardziej estetyczne obrazy niż modele v2.1 i (w mniejszym stopniu) v1.5.
- Nowy model generuje obrazy, które są dokładniejsze.
- Poprawiła się anatomia człowieka.
- Negatywne monity nie są tak potrzebne jak w wersji 2.1.
- Może tworzyć realistyczne portrety.
- Niektóre dziwactwa w modelu zostaną naprawione przed wydaniem.
Przeczytaj więcej powiązanych artykułów:
Odpowiedzialność
Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.
O autorze
Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.
Więcej artykułówDamir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.