Abril 10, 2023

Stability AI Llança un nou model anomenat SDXL Beta

Publicat: 10 d'abril de 2023 a les 8:00 Actualitzat: 10 d'abril de 2023 a les 8:00

En breu

Stability AI ha llançat un nou model anomenat SDXL Beta (Stable Diffusion XL Beta). És un model més gran amb més paràmetres i algunes millores desconegudes. Està disponible a DreamStudio, Stability AIés el generador oficial d'imatges de , i utilitza algorismes avançats i tècniques d'aprenentatge profund per crear imatges impressionants.

Stability AI ha presentat una vista prèvia d'un nou model anomenat SDXL Beta, abreviatura de Stable Diffusion XL Beta. Fins ara, l'empresa no ha compartit molta informació sobre el model, però està disponible per provar-ho per a qualsevol persona que ho vulgui fer. Què té de nou aquest model SDXL? stable diffusion? Quins són els seus avantatges i inconvenients? Investiguem.

Llegir més: Midjourney Abocador d'estils d'artista i Dall-E amb exemples: 130 tècniques de pintura famoses amb IA

Què és exactament el model SDXL?

El model SDXL és un model nou que hi ha actualment sent entrenat. Està lluny d'haver-se acabat, i quan s'estreni, molts detalls al respecte poden canviar; pel que sabem, potser ni tan sols es diu el model SDXL. Tot el que sabem és que és un model més gran amb més paràmetres i algunes millores desconegudes. És un model v2, no un model v3 (sigui el que signifiqui). És possible que les millores del model v2 puguin millorar el rendiment del sistema, però sense més informació, és difícil determinar la importància d'aquestes millores. A més, seria útil saber quins paràmetres específics s'han afegit o ajustat en aquesta versió.

El model SDXL està disponible actualment a DreamStudio, Stability AIel generador d'imatges oficial de. Seleccioneu SDXL Beta al menú del model per comprovar-ho. Sembla que utilitza algorismes avançats i tècniques d'aprenentatge profund per crear imatges impressionants que són perfectes per a una àmplia gamma d'aplicacions.

Millores

Text llegible. SDXL és capaç de generar text llegible i probablement és la seva característica més sorprenent, ja que no era possible als models v1 i v2.1 existents. El text generat per SDXL no sempre és precís, com podeu veure a Stable Diffusion Text a continuació. Tanmateix, és molt superior al model v2.1, i molt menys al model v1. Això es deu al fet que SDXLs utilitza un algorisme d'aprenentatge profund més avançat que li permet entendre i generar estructures de llenguatge més complexes. Amb un desenvolupament posterior, té el potencial de ser encara més precís i fiable.

Avís: foto d'un senyor sostenint un paper blanc que diu "No falsificacions"

Foto d'una dona pèl-roja sostenint un rètol negre amb fonts blanques que diu "No hi ha bromes". — Avís: foto d'una dona pèl-roja que sosté un cartell negre amb fonts blanques que diu "No hi ha bromes"

Avís: foto d'una dona xinesa asseguda en un cinema sostenint un plat amb la paraula "Dolor i avió" escrita.

Anatomia humana. La generació precisa de figures humanes anatòmicament correctes ha estat durant molt de temps un repte stable diffusion. És freqüent la presència d'extremitats addicionals o que falten. Normalment, l'Inpainting s'utilitza per arreglar-los o, més recentment, podeu utilitzar la funció Open Pose de ControlNet per duplicar una posició d'una imatge de referència. Ens complau observar que aquí és on ha millorat el model SDXL Beta. El model SDXL Beta ha mostrat una millora significativa en la duplicació precisa de posicions a partir d'imatges de referència. Aquesta pot ser una eina valuosa per a diverses aplicacions com l'animació i la realitat virtual.

Foto d'una dona amb un vestit esportiu fent girar la pilota a la mà dreta — Avís: foto d'una dona amb un vestit esportiu fent girar la pilota a la mà dreta

Foto d'un nen assegut sota la lluna vermella — Avís: foto d'un nen assegut sota la lluna vermella

Avís: una foto mostra un vell corrent al bosc.

Estil retrat. SDXL Beta produeix retrats excel·lents que semblen fotos: és una actualització en comparació amb la versió 1.5. L'algoritme millorat de SDXL Beta millora els detalls i la precisió del color dels retrats, donant com a resultat un aspecte més natural i realista. Els usuaris també poden ajustar els nivells de nitidesa i saturació per aconseguir els efectes desitjats.

Avís: fotografia d'una dona dels anys 80

Duoton. La paraula clau duoton sempre produeix fotos en blanc i negre al model v1.5. Tanmateix, ara, les imatges de bitons produïdes per SDXL Beta vénen en una varietat de colors. Està clar que en comparació amb els models v1, la capacitat de interpretar la indicació ha millorat, donant com a resultat respostes més precises i rellevants dels models v2, convertint-los en una eina més fiable per a les tasques de processament del llenguatge natural.

retrat d'un gos a l'estil duoton — Avís: retrat d'un gos d'estil biton

Avís: retrat en dos tons d'una jove africana

Estils artístics. Hi ha hagut alguns ajustos menors, però és difícil determinar si el nou model ofereix millors resultats, ja que simplement són únics. És possible que aquests ajustos siguin una qüestió de preferència personal o d'opinió subjectiva, cosa que dificulta la realització d'a defijudici nitiu sobre la seva qualitat. No obstant això, la singularitat dels ajustos pot ser notable i val la pena explorar-la més a fons.

v 1.5: Bosc Vell de Christopher Balaskas

Conclusió

Stable Diffusion finalment pot produir un text que tingui sentit.
SDXL proporciona imatges més estèticament agradables que els models v2.1 i (en menor mesura) els models v1.5.
El nou model produeix imatges més precises.
L'anatomia humana ha millorat.
Les indicacions negatives no són tan necessàries com a la v2.1.
Pot crear retrats realistes.
Algunes curiositats del model es solucionaran abans del llançament.

Llegeix més articles relacionats:

etiquetes:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet.

més articles

Damir Yalalov