Stability AI'С Stable Diffusion 2 Алгоритам је коначно јаван: нови дееп2имг модел, супер-резолуција, без садржаја за одрасле
Укратко
Stable Diffusion 2.0 модел је бржи, отвореног кода, скалабилан, робуснији од претходног
Stable Diffusion постаје спреман за ГПУ са новим функцијама за рендеровање у реалном времену
Вођен по дубини stable diffusion модел – Слика у слику са новим идејама за креативне апликације
Stability AI има ослобођен нови лист на свом блогу о Stable Diffusion 2. У њему, Stability AI предлаже нови алгоритам који је ефикаснији и робуснији од претходног, док га упореди са другим најсавременијим методама.
ЦомпВисов оригинал Stable Diffusion В1 модел револуционарно природа отвореног кода АИ модели и произвео стотине различитих модела и напретка широм света. Био је један од најбржих успона на 10,000 Гитхуб звезда, сакупио их је 33,000 за мање од два месеца, брже од више програма на Гитхуб-у.
Оригинални Stable Diffusion В1 издање је предводио динамични тим Робина Ромбаха (Stability AI) и Патрицк Ессер (Рунваи МЛ) из ЦомпВис групе на ЛМУ у Минхену, коју води проф. др Бјорн Оммер. Надоградили су се на претходни рад лабораторије са Латентом Дифузиони модели и добио је критичку подршку од ЛАИОН-а и Елеутхер АИ.
Оно што чини Stable Diffusion в1 различит од Stable Diffusion в2?
Stable Diffusion 2.0 укључује низ значајних побољшања и функција у односу на претходну верзију, па хајде да их погледамо.
Stable Diffusion 2.0 издање садржи робусне моделе текста у слику обучене са новим кодером текста (ОпенЦЛИП) који је развио ЛАИОН уз помоћ Stability AI, што значајно побољшава квалитет генерисане слике у односу на претходна В1 издања. Модели текста у слику овог издања могу да емитују слике са подразумеваним резолуцијама од 512×512 пиксела и 768×768 пиксела.
Ови модели су обучени коришћењем естетског подскупа скупа података ЛАИОН-5Б генерисаног од Stability AI'с ДеепФлоид тим, који се затим филтрира како би се искључио садржај за одрасле помоћу ЛАИОН-овог НСФВ филтера.
Процене које користе 50 корака узорка ДДИМ, 50 водећих скала без класификатора и 1.5, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0 и 8.0 указују на релативна побољшања контролних тачака:
Stable Diffusion 2.0 сада укључује модел Упсцалер Диффусион, који повећава резолуцију слике за фактор четири. Пример нашег модела упсцалинг генерисана слика ниског квалитета (128×128) у слику веће резолуције је приказана испод (512×512). Stable Diffusion 2.0, када се комбинује са нашим моделима текста у слику, сада може да генерише слике са резолуцијама од 2048×2048 или више.
Нови вођени дубином stable diffusion модел, дееп2имг, проширује претходну функцију слика-на-слику из В1 са потпуно новим креативним могућностима. Дептх2имг одређује дубину улазне слике (користећи постојећи модел), а затим генерише нови слике на основу и текста и информација о дубини. Дептх-то-Имаге може да обезбеди мноштво нових креативних апликација, нудећи промене које изгледају значајно другачије од оригинала, а истовремено задржавају кохерентност и дубину слике.
Шта је ново у Stable Diffusion 2?
- Нове stable diffusion модел нуди резолуцију 768 × 768.
- У-Нет има исту количину параметара као и верзија 1.5, али је обучен од нуле и користи ОпенЦЛИП-ВиТ/Х као свој текстуални кодер. Такозвани модел в-предвиђења је СД 2.0-в.
- Горе поменути модел је прилагођен са СД 2.0 базе, која је такође доступна и обучена као типичан модел за предвиђање шума на сликама од 512×512.
- Додан је латентни текст вођен модел дифузије са к4 скалирањем.
- Рафинирани СД 2.0-база са вођењем дубине stable diffusion модел. Модел се може користити за имг2имг са очувањем структуре и синтезу условљеног облика и условљен је монокуларним проценама дубине које изводи МиДаС.
- Побољшани модел сликања вођен текстом изграђен на основи СД 2.0.
Програмери су напорно радили, баш као и почетна итерација Stable Diffusion, да оптимизују модел за рад на једном ГПУ-у — желели су да га учине доступним што већем броју људи од самог почетка. Већ су видели шта се дешава када се милиони појединаца дочепају ових модела и сарађују како би направили апсолутно изванредне ствари. Ово је моћ отвореног кода: искориштавање огромног потенцијала милиона талентованих људи који можда немају ресурсе да обуче најсавременији модел, али имају способност да раде невероватне ствари са њим.
Ово ново ажурирање, у комбинацији са моћним новим функцијама као што је дееп2имг и боље могућности повећања резолуције, послужиће као основа за мноштво нових апликација и омогућити експлозију новог креативног потенцијала.
Прочитајте више о Stable Diffusion:
Одрицање од одговорности
У складу са Смернице пројекта Труст, имајте на уму да информације дате на овој страници нису намењене и не треба да се тумаче као правни, порески, инвестициони, финансијски или било који други облик савета. Важно је да инвестирате само оно што можете приуштити да изгубите и да тражите независан финансијски савет ако сумњате. За додатне информације, предлажемо да погледате одредбе и услове, као и странице помоћи и подршке које пружа издавач или оглашивач. MetaversePost је посвећен тачном, непристрасном извештавању, али тржишни услови су подложни променама без претходне најаве.
О аутору
Дамир је вођа тима, менаџер производа и уредник у Metaverse Post, покривајући теме као што су АИ/МЛ, АГИ, ЛЛМ, Метаверсе и Web3-сродна поља. Његови чланци привлаче огромну публику од преко милион корисника сваког месеца. Чини се да је стручњак са 10 година искуства у СЕО и дигиталном маркетингу. Дамир се помиње у Масхабле, Виред, Cointelegraph, Тхе Нев Иоркер, Инсиде.цом, Ентрепренеур, БеИнЦрипто и друге публикације. Путује између УАЕ, Турске, Русије и ЗНД као дигитални номад. Дамир је стекао диплому физике, за коју верује да му је дало вештине критичког размишљања које су му потребне да буде успешан у свету интернета који се стално мења.
više чланакаДамир је вођа тима, менаџер производа и уредник у Metaverse Post, покривајући теме као што су АИ/МЛ, АГИ, ЛЛМ, Метаверсе и Web3-сродна поља. Његови чланци привлаче огромну публику од преко милион корисника сваког месеца. Чини се да је стручњак са 10 година искуства у СЕО и дигиталном маркетингу. Дамир се помиње у Масхабле, Виред, Cointelegraph, Тхе Нев Иоркер, Инсиде.цом, Ентрепренеур, БеИнЦрипто и друге публикације. Путује између УАЕ, Турске, Русије и ЗНД као дигитални номад. Дамир је стекао диплому физике, за коју верује да му је дало вештине критичког размишљања које су му потребне да буде успешан у свету интернета који се стално мења.