Tudósítást Technológia
April 10, 2023

Stability AI Kiad egy új modellt, SDXL Beta néven

Röviden

Stability AI kiadott egy új modellt SDXL Beta néven (Stable Diffusion XL Béta). Ez egy nagyobb modell több paraméterrel és néhány ismeretlen fejlesztéssel. Elérhető a DreamStudióban, Stability AIhivatalos képgenerátora, és fejlett algoritmusokat és mély tanulási technikákat használ lenyűgöző látványelemek létrehozásához.

Stability AI bemutatta az SDXL Beta nevű új modell előzetesét, rövidítése Stable Diffusion XL Béta. A cég egyelőre nem sok információt osztott meg a modellről, de kipróbálható, aki erre vágyik. Mire újszerű ez az SDXL modell? stable diffusion? Mik az előnyei és a hátrányai? Vizsgáljuk meg.

Bővebben: Midjourney és Dall-E Artist Styles Dump példákkal: 130 híres mesterséges intelligencia festési technika

Mi is pontosan az SDXL modell?

Az SDXL modell egy új modell, amely jelenleg képezik. Még messze nem készült el, és mire megjelenik, sok részlet változhat vele kapcsolatban; Annyit tudunk, hogy nem is SDXL modellnek hívják. Csak annyit tudunk, hogy ez egy nagyobb modell, több paraméterrel és néhány ismeretlen fejlesztéssel. Ez egy v2 modell, nem egy v3 modell (bármit is jelentsen ez). Lehetséges, hogy a v2 modell fejlesztései javíthatják a rendszer teljesítményét, de további információk nélkül nehéz meghatározni, hogy ezek a fejlesztések mennyire jelentősek. Ezenkívül hasznos lenne tudni, hogy milyen konkrét paraméterek kerültek hozzáadásra vagy módosításra ebben a verzióban.

Az SDXL modell jelenleg elérhető a DreamStudióban, Stability AIhivatalos képgenerátora. Válassza az SDXL Beta lehetőséget a modellmenüből, hogy megnézze. Úgy tűnik, hogy fejlett algoritmusokat használ és mély tanulási technikák lenyűgöző látványelemek létrehozásához, amelyek tökéletesek az alkalmazások széles körében.

Mi is pontosan az SDXL modell?

Fejlesztések

Olvasható szöveg. Az SDXL képes olvasható szöveg generálására, és valószínűleg ez a legszembetűnőbb tulajdonsága, mivel ez a meglévő v1 és v2.1 modellekben nem volt lehetséges. Az SDXL által generált szöveg nem mindig pontos, amint az a Stable Diffusion Szöveg lent. Azonban sokkal jobb, mint a v2.1, nem is beszélve a v1 modellről. Ennek az az oka, hogy az SDXL-ek fejlettebb mély tanulási algoritmust használnak, amely lehetővé teszi bonyolultabb nyelvi struktúrák megértését és létrehozását. A további fejlesztésekkel még pontosabbá és megbízhatóbbá válik.

Felszólítás: fénykép egy úriemberről, aki egy fehér papírt tart, amelyen az áll, hogy „No Fakes”
Felszólítás: fénykép egy úriemberről, aki egy fehér papírt tart, amelyen az áll, hogy „No Fakes”
Fénykép egy vörös hajú nőről, aki egy fekete feliratot tart, fehér betűtípussal, amelyen ez áll: „Nem viccek”
Kérdés: Fotó egy vörös hajú nőről, aki egy fekete táblát tart fehér betűtípussal, amelyen az áll, hogy „Nem viccek”
Kérdés: Fotó egy kínai nőről, aki egy moziban ül, kezében egy tányérral, amelyen a „Pain and Plane” felirat szerepel.
Prompt: Fotó egy kínai nőről, aki egy moziban ül, kezében egy tányérral, amelyen a „Pain and Plane” felirat szerepel.

Emberi anatómia. Az anatómiailag helyes emberi alakok pontos generálása régóta kihívást jelent a számára stable diffusion. Gyakori a további vagy hiányzó végtagok jelenléte. Általában a befestést használják ezek kijavítására, vagy újabban a ControlNet Open Pose funkciójával is lemásolhat egy pózt egy referenciaképről. Örömmel vettük tudomásul, hogy itt fejlődött az SDXL Beta modell. Az SDXL béta modell jelentős javulást mutatott a referenciaképekről készült pózok pontos lemásolásában. Ez értékes eszköz lehet különféle alkalmazásokhoz, például animációhoz és virtuális valósághoz.

Fénykép egy sportruhás nőről, aki a jobb kezében pörgeti a labdát
Prompt: Fénykép egy sportruhás nőről, aki jobb kezében pörgeti a labdát
Fénykép egy fiúról, aki a vörös hold alatt ül
Prompt: Fotó egy fiúról, aki a vörös hold alatt ül
Kérdés: Egy fotón egy idős férfi látható az erdőben.

Portré stílus. Az SDXL Beta kiváló portrékat készít, amelyek úgy néznek ki, mint a fényképek – ez egy frissítés az 1.5-ös verzióhoz képest. Az SDXL Beta továbbfejlesztett algoritmusa javítja a portrék részleteit és színpontosságát, ami természetesebb és valósághűbb megjelenést eredményez. A felhasználók az élesség és a telítettség szintjét is beállíthatják a kívánt hatás elérése érdekében.

Prompt: egy kép egy fiúról és egy lányról
Prompt: egy kép egy fiúról és egy lányról
Felszólítás: egy kövér srác portréfotója
Felszólítás: egy kövér srác portréfotója
Prompt: egy fénykép egy 80-as évekbeli nőről
Prompt: egy fénykép egy 80-as évekbeli nőről

Duuotone. A duotone kulcsszó mindig fekete-fehér képeket hoz létre a v1.5 modellben. Jelenleg azonban az SDXL Beta által előállított kéttónusú képek többféle színben kaphatók. Nyilvánvaló, hogy a v1-es modellekhez képest az a képesség, hogy értelmezze a felszólítást javult, pontosabb és relevánsabb válaszokat eredményezve a v2 modellekből, így megbízhatóbb eszközzé vált a természetes nyelvi feldolgozási feladatokhoz.

kéttónusú stílusú portré egy kutya
Felszólítás: egy kutya kéttónusú portréja
kéttónusú táj a szigeten
Prompt: a sziget kéttónusú tájképe
fiatal afrikai nő kéttónusú portréja
Prompt: fiatal afrikai nő kéttónusú portréja

Művészi stílusok. Volt néhány apróbb módosítás, de nehéz megállapítani, hogy az új modell jobb eredményeket nyújt-e, mivel egyszerűen egyediek. Lehetséges, hogy ezek a módosítások személyes preferenciák vagy szubjektív vélemény kérdései lehetnek, ami megnehezíti a defiminőségi megítélésükről. Mindazonáltal a kiigazítások egyedisége figyelemre méltó lehet, és érdemes tovább vizsgálni.

New York, Ivan Aivazovsky
v 1.5: New York, Ivan Aivazovsky
New York, Ivan Aivazovsky
SDXL: New York, Ivan Aivazovsky
Balaskas Kristóf Öreg erdő
v 1.5: Öreg erdő, Christopher Balaskas
Balaskas Kristóf Öreg erdő
SDXL: Öreg erdő, Christopher Balaskas

Következtetés

  • Stable Diffusion végre értelmes szöveget produkálhat.
  • Az SDXL esztétikusabb képeket biztosít, mint a v2.1 és (kisebb mértékben) a v1.5 modellek.
  • Az új modell pontosabb képeket készít.
  • Az emberi anatómia javult.
  • A negatív promptok nem annyira szükségesek, mint a 2.1-es verzióban.
  • Valósághű portrékat tud készíteni.
  • A modell néhány furcsaságát a megjelenés előtt javítják.

Olvasson további kapcsolódó cikkeket:

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

További cikkek
Damir Jalalov
Damir Jalalov

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

Elérkezett az ítélethirdetés napja: CZ sorsa egyensúlyban van, mivel az Egyesült Államok bírósága mérlegeli a DOJ kérelmét

Changpeng Zhao ítéletet vár ma egy seattle-i amerikai bíróságon.

Tudjon meg többet

A Samourai Wallet alapítóit azzal vádolják, hogy 2 milliárd dollárt segítettek a Darknet ügyletekben

A Samourai Wallet alapítóinak aggodalma jelentős visszalépést jelent az iparág számára, aláhúzva a kitartó ...

Tudjon meg többet
Csatlakozzon innovatív technológiai közösségünkhöz
KATT ide
Tovább
Az Ankr együttműködik az AI Blockchain Platform Talus hálózatával, hogy feloldja a Bitcoin likviditását az AI számára
üzleti Tudósítást Technológia
Az Ankr együttműködik az AI Blockchain Platform Talus hálózatával, hogy feloldja a Bitcoin likviditását az AI számára
May 1, 2024
A Binance Labs támogatja a Movement Labsot, hogy megkönnyítse a Facebook Move-integrációját a blokkláncokon keresztül
üzleti Tudósítást Technológia
A Binance Labs támogatja a Movement Labsot, hogy megkönnyítse a Facebook Move-integrációját a blokkláncokon keresztül
May 1, 2024
BRICS Nemzetek Eye Stablecoin Kereskedelmi Megoldás
üzleti piacok Történetek és vélemények Technológia
BRICS Nemzetek Eye Stablecoin Kereskedelmi Megoldás
May 1, 2024
A Bitcoin L2 Network BOB integrálódik a LayerZero-val a továbbfejlesztett funkcionalitás érdekében
üzleti Tudósítást Technológia
A Bitcoin L2 Network BOB integrálódik a LayerZero-val a továbbfejlesztett funkcionalitás érdekében
May 1, 2024
CRYPTOMERIA LABS PTE. KFT.