Raport aktualności Technologia
10 kwietnia 2023 r.

Stability AI Wypuszcza nowy model o nazwie SDXL Beta

W skrócie

Stability AI wydała nowy model o nazwie SDXL Beta (Stable Diffusion XLBeta). Jest to większy model z większą liczbą parametrów i kilkoma nieznanymi ulepszeniami. Jest dostępny w DreamStudio, Stability AIjest oficjalnym generatorem obrazów i wykorzystuje zaawansowane algorytmy oraz techniki głębokiego uczenia się do tworzenia oszałamiających efektów wizualnych.

Stability AI zaprezentowała zapowiedź nowego modelu o nazwie SDXL Beta, skrót od Stable Diffusion Wersja XL Beta. Na razie firma nie podzieliła się zbyt wieloma informacjami na temat modelu, ale jest on dostępny do testów dla każdego, kto ma na to ochotę. Co jest nowatorskiego w tym modelu SDXL stable diffusion? Jakie są jego zalety i wady? Zbadajmy.

Czytaj więcej: Midjourney i Dall-E Artist Styles zrzut z przykładami: 130 słynnych technik malarskich AI

Czym dokładnie jest model SDXL?

Model SDXL to obecnie nowy model być szkolonym. Jest daleki od ukończenia, a do czasu jego wydania wiele szczegółów na jego temat może ulec zmianie; z tego, co wiemy, może nawet nie nazywać się modelem SDXL. Wiemy tylko, że jest to większy model z większą liczbą parametrów i kilkoma nieznanymi ulepszeniami. Jest to model v2, a nie model v3 (cokolwiek to znaczy). Możliwe, że ulepszenia w modelu v2 mogłyby poprawić wydajność systemu, ale bez dodatkowych informacji trudno jest określić, jak znaczące mogą być te ulepszenia. Dodatkowo przydałaby się informacja, jakie konkretne parametry zostały dodane lub dostosowane w tej wersji.

Model SDXL jest obecnie dostępny w DreamStudio, Stability AIoficjalny generator obrazów. Wybierz SDXL Beta z menu modelu, aby to sprawdzić. Wydaje się, że używa zaawansowanych algorytmów i techniki głębokiego uczenia się do tworzenia oszałamiających efektów wizualnych, które są idealne do szerokiego zakresu zastosowań.

Czym dokładnie jest model SDXL?

Ulepszenia

Czytelny tekst. SDXL jest w stanie generować czytelny tekst i jest to prawdopodobnie jego najbardziej uderzająca cecha, ponieważ nie było to możliwe w istniejących modelach v1 i v2.1. Wygenerowany tekst SDXL nie zawsze jest dokładny, jak widać w pliku Stable Diffusion Tekst poniżej. Jest jednak znacznie lepszy od wersji 2.1, nie mówiąc już o modelu v1. Dzieje się tak, ponieważ SDXLs wykorzystuje bardziej zaawansowany algorytm głębokiego uczenia się, który pozwala mu rozumieć i generować bardziej złożone struktury językowe. Dzięki dalszemu rozwojowi może stać się jeszcze dokładniejszy i bardziej niezawodny.

Podpowiedź: zdjęcie dżentelmena trzymającego białą kartkę z napisem „No Fakes”
Podpowiedź: zdjęcie dżentelmena trzymającego białą kartkę z napisem „No Fakes”
Zdjęcie rudowłosej kobiety trzymającej czarną tabliczkę z białymi czcionkami i napisem „Żadnych żartów”
Podpowiedź: zdjęcie rudowłosej kobiety trzymającej czarną tabliczkę z białymi czcionkami i napisem „Żadnych żartów”
Podpowiedź: zdjęcie Chinki siedzącej w kinie i trzymającej talerz z napisem „Pain and Plane”.
Podpowiedź: zdjęcie Chinki siedzącej w kinie i trzymającej talerz z napisem „Ból i płaszczyzna”.

Anatomia człowieka. Dokładne generowanie anatomicznie poprawnych postaci ludzkich od dawna stanowi wyzwanie stable diffusion. Obecność dodatkowych lub brakujących kończyn jest powszechna. Malowanie jest zwykle używane do ich naprawiania, a ostatnio możesz użyć funkcji Open Pose ControlNet, aby powielić pozę z obrazu referencyjnego. Cieszymy się, że w tym miejscu model SDXL Beta uległ poprawie. Model SDXL Beta wykazał znaczną poprawę w dokładnym powielaniu póz z obrazów referencyjnych. Może to być cenne narzędzie do różnych zastosowań, takich jak animacja i wirtualna rzeczywistość.

Zdjęcie kobiety w stroju sportowym kręcącej piłkę w prawej ręce
Podpowiedź: Zdjęcie kobiety w stroju sportowym, kręcącej piłkę w prawej ręce
Zdjęcie chłopca siedzącego pod czerwonym księżycem
Podpowiedź: zdjęcie chłopca siedzącego pod czerwonym księżycem
Podpowiedź: Zdjęcie przedstawia starca biegnącego przez las.

Styl portretowy. SDXL Beta tworzy doskonałe portrety, które wyglądają jak zdjęcia – to ulepszenie w stosunku do wersji 1.5. Udoskonalony algorytm SDXL Beta zwiększa szczegółowość i dokładność kolorów portretów, zapewniając bardziej naturalny i realistyczny wygląd. Użytkownicy mogą również dostosować poziomy ostrości i nasycenia, aby osiągnąć pożądane efekty.

Podpowiedź: zdjęcie chłopca i dziewczynki
Podpowiedź: zdjęcie chłopca i dziewczynki
Podpowiedź: zdjęcie portretowe grubasa
Podpowiedź: zdjęcie portretowe grubasa
Podpowiedź: zdjęcie kobiety z lat 80
Podpowiedź: zdjęcie kobiety z lat 80

dwutonowy. Słowo kluczowe duotone zawsze tworzy czarno-białe zdjęcia w modelu v1.5. Jednak teraz obrazy bichromii tworzone przez SDXL Beta są dostępne w różnych kolorach. Oczywiste jest, że w porównaniu z modelami v1, zdolność do zinterpretować monit uległa poprawie, co skutkuje dokładniejszymi i trafniejszymi odpowiedziami z modeli v2, czyniąc je bardziej niezawodnym narzędziem do zadań związanych z przetwarzaniem języka naturalnego.

portret psa w stylu bichromii
Podpowiedź: portret psa w stylu bichromii
dwutonowy krajobraz wyspy
Podpowiedź: dwutonowy krajobraz wyspy
dwutonowy portret młodej kobiety z Afryki
Podpowiedź: bichromatyczny portret młodej afrykańskiej kobiety

Style artystyczne. Wprowadzono kilka drobnych poprawek, ale trudno stwierdzić, czy nowy model zapewnia lepsze wyniki, ponieważ są one po prostu unikalne. Możliwe, że te korekty mogą być kwestią osobistych preferencji lub subiektywnej opinii, co utrudnia dokonanie defiwyraźną ocenę ich jakości. Niemniej jednak wyjątkowość dostosowań może być godna uwagi i warta dalszego zbadania.

Nowy Jork Ivan Aivazovsky
v 1.5: Nowy Jork autorstwa Ivana Aivazovsky'ego
Nowy Jork Ivan Aivazovsky
SDXL: Nowy Jork autorstwa Ivana Aivazovsky'ego
Stary Las Christophera Balaskasa
v 1.5: Old Forest autorstwa Christophera Balaskasa
Stary Las Christophera Balaskasa
SDXL: Old Forest autorstwa Christophera Balaskasa

Wnioski

  • Stable Diffusion może w końcu stworzyć tekst, który ma sens.
  • SDXL zapewnia bardziej estetyczne obrazy niż modele v2.1 i (w mniejszym stopniu) v1.5.
  • Nowy model generuje obrazy, które są dokładniejsze.
  • Poprawiła się anatomia człowieka.
  • Negatywne monity nie są tak potrzebne jak w wersji 2.1.
  • Może tworzyć realistyczne portrety.
  • Niektóre dziwactwa w modelu zostaną naprawione przed wydaniem.

Przeczytaj więcej powiązanych artykułów:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Więcej artykułów
Damir Jałałow
Damir Jałałow

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Hot Stories

Rozwiązanie handlu stabilną monetą BRICS Nations Eye

by Wiktoria Palchik
01 maja 2024 r.
Dołącz do naszego newslettera.
Najnowsze wieści

Nadchodzi dzień wyroku: los CZ wisi na włosku, gdy amerykański sąd rozpatruje skargę Departamentu Sprawiedliwości

Changpeng Zhao stanie dziś przed amerykańskim sądem w Seattle wyrokiem skazującym.

Dowiedz się więcej

Założyciele portfela Samourai oskarżeni o ułatwianie transakcji o wartości 2 miliardów dolarów w Darknet

Zaniepokojenie założycieli Samourai Wallet stanowi wyraźną porażkę dla branży, podkreślając utrzymujące się...

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Ankr współpracuje z platformą AI Blockchain Talus Network, aby odblokować płynność Bitcoinów dla sztucznej inteligencji
Biznes Raport aktualności Technologia
Ankr współpracuje z platformą AI Blockchain Talus Network, aby odblokować płynność Bitcoinów dla sztucznej inteligencji
1 maja 2024 r.
Binance Labs wspiera Movement Labs, aby ułatwić integrację Facebooka Move w ramach łańcuchów bloków
Biznes Raport aktualności Technologia
Binance Labs wspiera Movement Labs, aby ułatwić integrację Facebooka Move w ramach łańcuchów bloków
1 maja 2024 r.
Rozwiązanie handlu stabilną monetą BRICS Nations Eye
Biznes rynki Historie i recenzje Technologia
Rozwiązanie handlu stabilną monetą BRICS Nations Eye
1 maja 2024 r.
Bitcoin L2 Network BOB integruje się z LayerZero w celu zwiększenia funkcjonalności
Biznes Raport aktualności Technologia
Bitcoin L2 Network BOB integruje się z LayerZero w celu zwiększenia funkcjonalności
1 maja 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.