Новини Технологии
Април 10, 2023

Stability AI Пуска нов модел, наречен SDXL Beta

Накратко

Stability AI пусна нов модел, наречен SDXL Beta (Stable Diffusion XL бета). Това е по-голям модел с повече параметри и някои неизвестни подобрения. Предлага се в DreamStudio, Stability AIОфициален генератор на изображения и използва усъвършенствани алгоритми и техники за дълбоко обучение, за да създаде зашеметяващи визуализации.

Stability AI представи предварителен преглед на нов модел, наречен SDXL Beta, съкращение от Stable Diffusion XL бета. Засега компанията не е споделила много информация за модела, но той е достъпен за тестване за всеки, който иска да го направи. Какво е новото в този SDXL модел stable diffusion? Какви са неговите предимства и недостатъци? Нека да проучим.

Чети повече: Midjourney и Dall-E Artist Styles Dump с примери: 130 известни техники за рисуване с изкуствен интелект

Какво всъщност представлява моделът SDXL?

Моделът SDXL е нов модел, който в момента е се обучава. Той далеч не е завършен и докато бъде пуснат, много подробности за него може да се променят; доколкото знаем, може дори да не се нарича модел SDXL. Всичко, което знаем е, че това е по-голям модел с повече параметри и някои неизвестни подобрения. Това е модел v2, а не модел v3 (каквото и да означава това). Възможно е подобренията в модела v2 да подобрят производителността на системата, но без допълнителна информация е трудно да се определи колко значими могат да бъдат тези подобрения. Освен това би било полезно да знаете какви конкретни параметри са добавени или коригирани в тази версия.

Моделът SDXL в момента е наличен в DreamStudio, Stability AIофициален генератор на изображения. Изберете SDXL Beta от менюто на модела, за да го проверите. Изглежда, че използва усъвършенствани алгоритми и техники за дълбоко обучение за създаване на зашеметяващи визуализации, които са идеални за широк спектър от приложения.

Какво всъщност представлява моделът SDXL?

Подобрения

Четим текст. SDXL е способен да генерира четлив текст и вероятно е най-забележителната му характеристика, тъй като не беше възможно в съществуващите модели v1 и v2.1. Генерираният от SDXL текст не винаги е точен, както можете да видите в Stable Diffusion Текст по-долу. Въпреки това, той е много по-добър от v2.1, да не говорим за v1 модел. Това е така, защото SDXLs използва по-усъвършенстван алгоритъм за дълбоко обучение, който му позволява да разбира и генерира по-сложни езикови структури. С по-нататъшно развитие той има потенциала да стане още по-точен и надежден.

Подсказка: снимка на господин, който държи бяла хартия с надпис „Без фалшификати“
Подсказка: снимка на господин, който държи бяла хартия с надпис „Без фалшификати“
Снимка на червенокоса жена, която държи черен знак с бели шрифтове, на който пише „Без шеги“
Подсказка: Снимка на червенокоса жена, която държи черен знак с бели шрифтове, на който пише „Без шеги“
Подсказка: Снимка на китайка, седнала в кино, държаща чиния с надпис „Болка и равнина“.
Подсказка: Снимка на китайка, седнала в кино, държаща чиния с надпис „Болка и равнина“.

Човешка анатомия. Точното генериране на анатомично правилни човешки фигури отдавна е предизвикателство за stable diffusion. Наличието на допълнителни или липсващи крайници е често срещано явление. Inpainting обикновено се използва за коригирането им или, наскоро, можете да използвате функцията Open Pose на ControlNet, за да дублирате поза от референтно изображение. Радваме се да отбележим, че тук е подобрението на модела SDXL Beta. Моделът SDXL Beta показа значително подобрение в точното дублиране на пози от референтни изображения. Това може да бъде ценен инструмент за различни приложения като анимация и виртуална реалност.

Снимка на жена в спортен екип, която върти топката в дясната ръка
Подсказка: Снимка на жена в спортен екип, която върти топката в дясната ръка
Снимка на момче, седнало под червената луна
Подсказка: Снимка на момче, седнало под червената луна
Подсказка: Снимка показва старец, който тича в гората.

Портретен стил. SDXL Beta създава отлични портрети, които изглеждат като снимки – това е надстройка в сравнение с версия 1.5. Подобреният алгоритъм в SDXL Beta подобрява детайлите и точността на цветовете на портретите, което води до по-естествен и реалистичен вид. Потребителите могат също да регулират нивата на острота и наситеност, за да постигнат желаните от тях ефекти.

Подсказка: снимка на момче и момиче
Подсказка: снимка на момче и момиче
Подсказка: портретна снимка на дебел човек
Подсказка: портретна снимка на дебел човек
Подсказка: снимка на жена от 80-те
Подсказка: снимка на жена от 80-те

Duotone. Ключовата дума duotone винаги създава черно-бели снимки в модел v1.5. Сега обаче двуцветните изображения, произведени от SDXL Beta, се предлагат в различни цветове. Ясно е, че в сравнение с модели v1, възможността за интерпретирайте подканата се подобри, което води до по-точни и подходящи отговори от моделите v2, което ги прави по-надежден инструмент за задачи за обработка на естествен език.

портрет на куче в двуцветен стил
Подкана: портрет на куче в двуцветен стил
двуцветен пейзаж на острова
Подкана: двуцветен пейзаж на острова
двуцветен портрет на млада африканска жена
Подсказка: двуцветен портрет на млада африканка

Художествени стилове. Има някои малки корекции, но е трудно да се определи дали новият модел осигурява по-добри резултати, тъй като те са просто уникални. Възможно е тези корекции да са въпрос на лични предпочитания или субективно мнение, което затруднява извършването на a defiитивна преценка за тяхното качество. Независимо от това, уникалността на корекциите може да бъде забележителна и да си струва да се проучи допълнително.

Ню Йорк от Иван Айвазовски
v 1.5: Ню Йорк от Иван Айвазовски
Ню Йорк от Иван Айвазовски
SDXL: Ню Йорк от Иван Айвазовски
Стара гора от Кристофър Балакас
v 1.5: Стара гора от Кристофър Балакас
Стара гора от Кристофър Балакас
SDXL: Стара гора от Кристофър Балакас

Заключение

  • Stable Diffusion най-накрая може да създаде текст, който има смисъл.
  • SDXL предоставя по-естетически приятни изображения от моделите v2.1 и (в по-малка степен) v1.5.
  • Новият модел създава изображения, които са по-точни.
  • Човешката анатомия се е подобрила.
  • Отрицателните подкани не са толкова необходими, колкото във v2.1.
  • Може да създава реалистични портрети.
  • Някои странности в модела ще бъдат коригирани преди пускането му.

Прочетете още свързани статии:

Отказ от отговорност

В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.

За автора

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Още статии
Дамир Ялалов
Дамир Ялалов

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Hot Stories
Присъединете се към нашия бюлетин.
Последни новини

Пристига денят на присъдата: Съдбата на CZ виси на равновесие, докато американският съд разглежда молбата на DOJ

Changpeng Zhao е готов да бъде осъден днес в американски съд в Сиатъл.

Научете още

Основателите на портфейла Samourai са обвинени в улесняване на $2 милиарда в Darknet сделки

Заплахата от страна на основателите на портфейла Samourai Wallet представлява забележителна неуспех за индустрията, подчертавайки постоянните...

Научете още
Присъединете се към нашата иновативна техническа общност
Вижте повече
Прочети повече
Ankr си сътрудничи с AI Blockchain платформа Talus Network, за да отключи биткойн ликвидност за AI
Бизнес Новини Технологии
Ankr си сътрудничи с AI Blockchain платформа Talus Network, за да отключи биткойн ликвидност за AI
Май 1, 2024
Binance Labs поддържа Movement Labs, за да улесни интеграцията на Facebook Move в блокчейни
Бизнес Новини Технологии
Binance Labs поддържа Movement Labs, за да улесни интеграцията на Facebook Move в блокчейни
Май 1, 2024
BRICS Nations Eye Решение за търговия със стейбълкойни
Бизнес пазари Истории и рецензии Технологии
BRICS Nations Eye Решение за търговия със стейбълкойни
Май 1, 2024
Bitcoin L2 мрежа BOB се интегрира с LayerZero за подобрена функционалност
Бизнес Новини Технологии
Bitcoin L2 мрежа BOB се интегрира с LayerZero за подобрена функционалност
Май 1, 2024
CRYPTOMERIA LABS PTE. LTD.