Raport aktualności Technologia
23 czerwca 2023 r.

Midjourney 5.2 i Stable Diffusion Aktualizacje SDXL 0.9 do kreatywnego generowania tekstu na obraz

W skrócie

StabilityAI wydał najnowszy model, Stable Diffusion SDXL 0.9, który obiecuje lepszą percepcję monity i poprawiona szczegółowość obrazu.

Midjourney 5.2 wprowadza nowe funkcje, takie jak Outpainting, komenda /shorten, konfigurowalne wariacje i transformacja obrazu 1:1.

Oczekuje się, że te aktualizacje poprawią wrażenia użytkownika i zwiększą kreatywność w procesie twórczym.

Dzisiaj oba główne generatory zamiany tekstu na obraz wydały znaczące aktualizacje. Poprawiona dokładność generowania realistycznych obrazów z opisów tekstowych, a także nowe funkcje, które pozwalają użytkownikom kontrolować styl i kompozycję generowanych obrazów.

Midjourney 5.2 i Stable Diffusion Aktualizacje SDXL 0.9 do kreatywnego generowania obrazów
kredyt: Midjourney

Nowe funkcje w Midjourney 5.2

Oprócz StabilityAIaktualizacje, Midjourney wprowadził również ekscytujące funkcje wraz z wydaniem Midjourney 5.2. Godnym uwagi dodatkiem jest funkcja Zoom Out, która przypomina Wypełnianie generatywne firmy Adobe dla programu Photoshop. Należy jednak pamiętać, że MidjourneyFunkcja Zoom Out nie obejmuje masek, a wynik w dużej mierze zależy od zakresu parametru „do Out”.

Midjourney Wersja 5.2 zapewnia szereg nowych możliwości, które poprawiają komfort użytkowania. Warto zauważyć, że wydanie Stable Diffusion XL 0.9 przyćmił silną aktualizację w Midjourney, którą wielu użytkowników początkowo przeoczyło.

Niektóre z kluczowych funkcji i ulepszeń w Midjourney 5.2:

  • Outpainting: Użytkownicy mogą teraz eksplorować funkcję Outpainting z opcjami takimi jak 1.5, 2 i ustawieniami niestandardowymi. Ta funkcja, używana iteracyjnie, daje imponujące wyniki.
  • Konfigurowalne wariacje: Siła wariacji w Midjourney jest teraz konfigurowalny. Użytkownicy mogą bez wysiłku przełączać się między słabymi i mocnymi odmianami, wybierając dwa przyciski, oferując większą elastyczność w procesie twórczym.
  • Transformacja obrazu 1:1: Midjourney teraz pozwala użytkownikom przekształcić dowolny obraz w kwadrat o proporcjach 1:1, co umożliwia płynną integrację w różnych kontekstach.

Tak więc, Midjourney 5.2 wprowadził nową funkcję zwaną parserem podpowiedzi, dzięki czemu generowanie imponujących obrazów jest jeszcze łatwiejsze. Za pomocą polecenia „/skróć [twój znak zachęty]” użytkownicy mogą teraz identyfikować ważne słowa i eliminować niepotrzebne, optymalizując monity o najlepsze wyniki. Parser przypisuje również wagi każdemu słowu, umożliwiając użytkownikom wybór spośród pięciu opcji najbardziej odpowiedniego monitu. Mówiąc prościej, pomaga przekształcić niejasne pomysły w podpowiedź, która lepiej pasuje do intencji i potrzeb użytkowników.

Jeśli chodzi o kontrolę procesu, Midjourney dogonił konkurencję. Jednak pod względem łatwości obsługi Midjourney pozostaje w tyle. Ci, którzy szukają wygody zamiast elastyczności, mogą być atrakcyjni Adobe Firefly'a, konkurencyjna platforma znana z przyjaznych dla użytkownika funkcji. Z drugiej strony, Stable Diffusion, ze swoim otwartym kodem źródłowym i rozszerzeniami, oferuje niezrównaną elastyczność. Pomimo StabilityAISporadyczne opóźnienia i niejednoznaczne stwierdzenia, takie jak „50% wytrenowania” i „będzie dostępny w połowie lipca, ale to jest niedokładne”, gdy wagi staną się dostępne, wszystko ułoży się gładko.

Dzięki tym postępom Midjourney nadal zapewnia ekscytujące funkcje łatwego i wydajnego generowania obrazów. Użytkownicy mogą teraz cieszyć się większą kontrolą nad swoimi monitami, co skutkuje lepszymi wynikami. W miarę postępu technologii platformy takie jak Midjourney mają na celu poprawę doświadczeń użytkowników i uczynienie kreatywnych przedsięwzięć bardziej dostępnymi dla wszystkich.

Ponadto najnowsza wersja Midjourney podkreśla realizm, szczególnie zauważalny w pokolenie sztuki. Aby podkreślić te ulepszenia, dokonano porównania podpowiedzi i elementu początkowego Midjourney wersje 5.1 i 5.2.

Świeżo wygenerowane przykłady autorstwa Midjourney 5.2:

Nowe funkcje w Stable Diffusion SDXL 0.9

StabilityAI dokonał ulepszeń wraz z wydaniem swojego najnowszego modelu, Stable Diffusion SDXL 0.9. Obiecują lepszą percepcję monity i ulepszona szczegółowość obrazu, umożliwiająca użytkownikom tworzenie bardziej urzekających efektów wizualnych. Co więcej, możesz już wypróbować nowy model za darmo KlipDrop.

Połączenia Stable Diffusion Model SDXL 0.9 przyciąga uwagę od czasu jego publikacji przez StabilityAI. Chociaż oficjalne potwierdzenie wydania jest dostępne, ale link nie został jeszcze podany. Model SDXL 0.9 w swojej podstawowej wersji może pochwalić się imponującymi parametrami 3.5 mld. Dodatkowo w planach jest kolejny zestaw dwóch modeli o łącznej wartości 6.6 mld parametrów.

Aby osiągnąć lepsze generowanie obrazu, StabilityAI wykorzystuje konkatenację dwóch modeli CLIP: podstawowy klip z OpenAI i OpenCLIP ViT-G/14. Ta fuzja pozwala na generowanie dokładniejszych szczegółów na zdjęciach. Sparowane porównania zdjęć między Wersja beta SDXL a nowa wersja, SDXL 0.9, wyraźnie pokazuje znaczną poprawę jakości.

Warto zauważyć, że korzystanie z modelu SDXL 0.9 podczas wnioskowania wymaga karty graficznej z co najmniej 16 GB VRAM, aby zapewnić płynne działanie. Ponieważ użytkownicy z niecierpliwością czekają na obszerny wpis na blogu ze wszystkimi szczegółami i wydaniem kodu, istnieje oczekiwanie na dalsze ulepszenia i możliwości.

Świeżo wygenerowane przykłady przez SDXL 0.9:

Przeczytaj więcej o sztucznej inteligencji:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Więcej artykułów
Damir Jałałow
Damir Jałałow

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Apetyt instytucjonalny na ETFy Bitcoin rośnie w obliczu zmienności

Ujawnienia zawarte w zgłoszeniach 13F ujawniają, że znaczący inwestorzy instytucjonalni parają się funduszami ETF Bitcoin, co podkreśla rosnącą akceptację…

Dowiedz się więcej

Nadchodzi dzień wyroku: los CZ wisi na włosku, gdy amerykański sąd rozpatruje skargę Departamentu Sprawiedliwości

Changpeng Zhao stanie dziś przed amerykańskim sądem w Seattle wyrokiem skazującym.

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Przejście Donalda Trumpa na kryptowaluty: od przeciwnika do adwokata i co to oznacza dla amerykańskiego rynku kryptowalut
Biznes rynki Historie i recenzje Technologia
Przejście Donalda Trumpa na kryptowaluty: od przeciwnika do adwokata i co to oznacza dla amerykańskiego rynku kryptowalut
10 maja 2024 r.
Warstwa 3 uruchomi token L3 tego lata, przydzielając 51% całkowitej podaży społeczności
rynki Raport aktualności Technologia
Warstwa 3 uruchomi token L3 tego lata, przydzielając 51% całkowitej podaży społeczności
10 maja 2024 r.
Ostatnie ostrzeżenie Edwarda Snowdena dla twórców Bitcoina: „Uczyń prywatność priorytetem na poziomie protokołu, w przeciwnym razie ryzykuj jej utratę
rynki Bezpieczeństwo Wiki Tworzenie Historie i recenzje Technologia
Ostatnie ostrzeżenie Edwarda Snowdena dla twórców Bitcoina: „Uczyń prywatność priorytetem na poziomie protokołu, w przeciwnym razie ryzykuj jej utratę
10 maja 2024 r.
Oparta na optymizmie sieć Ethereum Layer 2 Network Mint uruchomi swoją sieć główną 15 maja
Raport aktualności Technologia
Oparta na optymizmie sieć Ethereum Layer 2 Network Mint uruchomi swoją sieć główną 15 maja
10 maja 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.