Stability AI Пуска нов модел, наречен SDXL Beta
Накратко
Stability AI пусна нов модел, наречен SDXL Beta (Stable Diffusion XL бета). Това е по-голям модел с повече параметри и някои неизвестни подобрения. Предлага се в DreamStudio, Stability AIОфициален генератор на изображения и използва усъвършенствани алгоритми и техники за дълбоко обучение, за да създаде зашеметяващи визуализации.
Stability AI представи предварителен преглед на нов модел, наречен SDXL Beta, съкращение от Stable Diffusion XL бета. Засега компанията не е споделила много информация за модела, но той е достъпен за тестване за всеки, който иска да го направи. Какво е новото в този SDXL модел stable diffusion? Какви са неговите предимства и недостатъци? Нека да проучим.
Чети повече: Midjourney и Dall-E Artist Styles Dump с примери: 130 известни техники за рисуване с изкуствен интелект |
Какво всъщност представлява моделът SDXL?
Моделът SDXL е нов модел, който в момента е се обучава. Той далеч не е завършен и докато бъде пуснат, много подробности за него може да се променят; доколкото знаем, може дори да не се нарича модел SDXL. Всичко, което знаем е, че това е по-голям модел с повече параметри и някои неизвестни подобрения. Това е модел v2, а не модел v3 (каквото и да означава това). Възможно е подобренията в модела v2 да подобрят производителността на системата, но без допълнителна информация е трудно да се определи колко значими могат да бъдат тези подобрения. Освен това би било полезно да знаете какви конкретни параметри са добавени или коригирани в тази версия.
Моделът SDXL в момента е наличен в DreamStudio, Stability AIофициален генератор на изображения. Изберете SDXL Beta от менюто на модела, за да го проверите. Изглежда, че използва усъвършенствани алгоритми и техники за дълбоко обучение за създаване на зашеметяващи визуализации, които са идеални за широк спектър от приложения.
Подобрения
Четим текст. SDXL е способен да генерира четлив текст и вероятно е най-забележителната му характеристика, тъй като не беше възможно в съществуващите модели v1 и v2.1. Генерираният от SDXL текст не винаги е точен, както можете да видите в Stable Diffusion Текст по-долу. Въпреки това, той е много по-добър от v2.1, да не говорим за v1 модел. Това е така, защото SDXLs използва по-усъвършенстван алгоритъм за дълбоко обучение, който му позволява да разбира и генерира по-сложни езикови структури. С по-нататъшно развитие той има потенциала да стане още по-точен и надежден.
Човешка анатомия. Точното генериране на анатомично правилни човешки фигури отдавна е предизвикателство за stable diffusion. Наличието на допълнителни или липсващи крайници е често срещано явление. Inpainting обикновено се използва за коригирането им или, наскоро, можете да използвате функцията Open Pose на ControlNet, за да дублирате поза от референтно изображение. Радваме се да отбележим, че тук е подобрението на модела SDXL Beta. Моделът SDXL Beta показа значително подобрение в точното дублиране на пози от референтни изображения. Това може да бъде ценен инструмент за различни приложения като анимация и виртуална реалност.
Портретен стил. SDXL Beta създава отлични портрети, които изглеждат като снимки – това е надстройка в сравнение с версия 1.5. Подобреният алгоритъм в SDXL Beta подобрява детайлите и точността на цветовете на портретите, което води до по-естествен и реалистичен вид. Потребителите могат също да регулират нивата на острота и наситеност, за да постигнат желаните от тях ефекти.
Duotone. Ключовата дума duotone винаги създава черно-бели снимки в модел v1.5. Сега обаче двуцветните изображения, произведени от SDXL Beta, се предлагат в различни цветове. Ясно е, че в сравнение с модели v1, възможността за интерпретирайте подканата се подобри, което води до по-точни и подходящи отговори от моделите v2, което ги прави по-надежден инструмент за задачи за обработка на естествен език.
Художествени стилове. Има някои малки корекции, но е трудно да се определи дали новият модел осигурява по-добри резултати, тъй като те са просто уникални. Възможно е тези корекции да са въпрос на лични предпочитания или субективно мнение, което затруднява извършването на a defiитивна преценка за тяхното качество. Независимо от това, уникалността на корекциите може да бъде забележителна и да си струва да се проучи допълнително.
Заключение
- Stable Diffusion най-накрая може да създаде текст, който има смисъл.
- SDXL предоставя по-естетически приятни изображения от моделите v2.1 и (в по-малка степен) v1.5.
- Новият модел създава изображения, които са по-точни.
- Човешката анатомия се е подобрила.
- Отрицателните подкани не са толкова необходими, колкото във v2.1.
- Може да създава реалистични портрети.
- Някои странности в модела ще бъдат коригирани преди пускането му.
Прочетете още свързани статии:
Отказ от отговорност
В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.
За автора
Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет.
Още статииДамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет.