Stability AI Kiad egy új modellt, SDXL Beta néven
Röviden
Stability AI kiadott egy új modellt SDXL Beta néven (Stable Diffusion XL Béta). Ez egy nagyobb modell több paraméterrel és néhány ismeretlen fejlesztéssel. Elérhető a DreamStudióban, Stability AIhivatalos képgenerátora, és fejlett algoritmusokat és mély tanulási technikákat használ lenyűgöző látványelemek létrehozásához.
Stability AI bemutatta az SDXL Beta nevű új modell előzetesét, rövidítése Stable Diffusion XL Béta. A cég egyelőre nem sok információt osztott meg a modellről, de kipróbálható, aki erre vágyik. Mire újszerű ez az SDXL modell? stable diffusion? Mik az előnyei és a hátrányai? Vizsgáljuk meg.
Mi is pontosan az SDXL modell?
Az SDXL modell egy új modell, amely jelenleg képezik. Még messze nem készült el, és mire megjelenik, sok részlet változhat vele kapcsolatban; Annyit tudunk, hogy nem is SDXL modellnek hívják. Csak annyit tudunk, hogy ez egy nagyobb modell, több paraméterrel és néhány ismeretlen fejlesztéssel. Ez egy v2 modell, nem egy v3 modell (bármit is jelentsen ez). Lehetséges, hogy a v2 modell fejlesztései javíthatják a rendszer teljesítményét, de további információk nélkül nehéz meghatározni, hogy ezek a fejlesztések mennyire jelentősek. Ezenkívül hasznos lenne tudni, hogy milyen konkrét paraméterek kerültek hozzáadásra vagy módosításra ebben a verzióban.
Az SDXL modell jelenleg elérhető a DreamStudióban, Stability AIhivatalos képgenerátora. Válassza az SDXL Beta lehetőséget a modellmenüből, hogy megnézze. Úgy tűnik, hogy fejlett algoritmusokat használ és mély tanulási technikák lenyűgöző látványelemek létrehozásához, amelyek tökéletesek az alkalmazások széles körében.
Fejlesztések
Olvasható szöveg. Az SDXL képes olvasható szöveg generálására, és valószínűleg ez a legszembetűnőbb tulajdonsága, mivel ez a meglévő v1 és v2.1 modellekben nem volt lehetséges. Az SDXL által generált szöveg nem mindig pontos, amint az a Stable Diffusion Szöveg lent. Azonban sokkal jobb, mint a v2.1, nem is beszélve a v1 modellről. Ennek az az oka, hogy az SDXL-ek fejlettebb mély tanulási algoritmust használnak, amely lehetővé teszi bonyolultabb nyelvi struktúrák megértését és létrehozását. A további fejlesztésekkel még pontosabbá és megbízhatóbbá válik.
Emberi anatómia. Az anatómiailag helyes emberi alakok pontos generálása régóta kihívást jelent a számára stable diffusion. Gyakori a további vagy hiányzó végtagok jelenléte. Általában a befestést használják ezek kijavítására, vagy újabban a ControlNet Open Pose funkciójával is lemásolhat egy pózt egy referenciaképről. Örömmel vettük tudomásul, hogy itt fejlődött az SDXL Beta modell. Az SDXL béta modell jelentős javulást mutatott a referenciaképekről készült pózok pontos lemásolásában. Ez értékes eszköz lehet különféle alkalmazásokhoz, például animációhoz és virtuális valósághoz.
Portré stílus. Az SDXL Beta kiváló portrékat készít, amelyek úgy néznek ki, mint a fényképek – ez egy frissítés az 1.5-ös verzióhoz képest. Az SDXL Beta továbbfejlesztett algoritmusa javítja a portrék részleteit és színpontosságát, ami természetesebb és valósághűbb megjelenést eredményez. A felhasználók az élesség és a telítettség szintjét is beállíthatják a kívánt hatás elérése érdekében.
Duuotone. A duotone kulcsszó mindig fekete-fehér képeket hoz létre a v1.5 modellben. Jelenleg azonban az SDXL Beta által előállított kéttónusú képek többféle színben kaphatók. Nyilvánvaló, hogy a v1-es modellekhez képest az a képesség, hogy értelmezze a felszólítást javult, pontosabb és relevánsabb válaszokat eredményezve a v2 modellekből, így megbízhatóbb eszközzé vált a természetes nyelvi feldolgozási feladatokhoz.
Művészi stílusok. Volt néhány apróbb módosítás, de nehéz megállapítani, hogy az új modell jobb eredményeket nyújt-e, mivel egyszerűen egyediek. Lehetséges, hogy ezek a módosítások személyes preferenciák vagy szubjektív vélemény kérdései lehetnek, ami megnehezíti a defiminőségi megítélésükről. Mindazonáltal a kiigazítások egyedisége figyelemre méltó lehet, és érdemes tovább vizsgálni.
Következtetés
- Stable Diffusion végre értelmes szöveget produkálhat.
- Az SDXL esztétikusabb képeket biztosít, mint a v2.1 és (kisebb mértékben) a v1.5 modellek.
- Az új modell pontosabb képeket készít.
- Az emberi anatómia javult.
- A negatív promptok nem annyira szükségesek, mint a 2.1-es verzióban.
- Valósághű portrékat tud készíteni.
- A modell néhány furcsaságát a megjelenés előtt javítják.
Olvasson további kapcsolódó cikkeket:
A felelősség megtagadása
Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.
A szerzőről
Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján.
További cikkekDamir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján.