Stability AI Llança un nou model anomenat SDXL Beta
En breu
Stability AI ha llançat un nou model anomenat SDXL Beta (Stable Diffusion XL Beta). És un model més gran amb més paràmetres i algunes millores desconegudes. Està disponible a DreamStudio, Stability AIés el generador oficial d'imatges de , i utilitza algorismes avançats i tècniques d'aprenentatge profund per crear imatges impressionants.
Stability AI ha presentat una vista prèvia d'un nou model anomenat SDXL Beta, abreviatura de Stable Diffusion XL Beta. Fins ara, l'empresa no ha compartit molta informació sobre el model, però està disponible per provar-ho per a qualsevol persona que ho vulgui fer. Què té de nou aquest model SDXL? stable diffusion? Quins són els seus avantatges i inconvenients? Investiguem.
Llegir més: Midjourney Abocador d'estils d'artista i Dall-E amb exemples: 130 tècniques de pintura famoses amb IA |
Què és exactament el model SDXL?
El model SDXL és un model nou que hi ha actualment sent entrenat. Està lluny d'haver-se acabat, i quan s'estreni, molts detalls al respecte poden canviar; pel que sabem, potser ni tan sols es diu el model SDXL. Tot el que sabem és que és un model més gran amb més paràmetres i algunes millores desconegudes. És un model v2, no un model v3 (sigui el que signifiqui). És possible que les millores del model v2 puguin millorar el rendiment del sistema, però sense més informació, és difícil determinar la importància d'aquestes millores. A més, seria útil saber quins paràmetres específics s'han afegit o ajustat en aquesta versió.
El model SDXL està disponible actualment a DreamStudio, Stability AIel generador d'imatges oficial de. Seleccioneu SDXL Beta al menú del model per comprovar-ho. Sembla que utilitza algorismes avançats i tècniques d'aprenentatge profund per crear imatges impressionants que són perfectes per a una àmplia gamma d'aplicacions.
Millores
Text llegible. SDXL és capaç de generar text llegible i probablement és la seva característica més sorprenent, ja que no era possible als models v1 i v2.1 existents. El text generat per SDXL no sempre és precís, com podeu veure a Stable Diffusion Text a continuació. Tanmateix, és molt superior al model v2.1, i molt menys al model v1. Això es deu al fet que SDXLs utilitza un algorisme d'aprenentatge profund més avançat que li permet entendre i generar estructures de llenguatge més complexes. Amb un desenvolupament posterior, té el potencial de ser encara més precís i fiable.
Anatomia humana. La generació precisa de figures humanes anatòmicament correctes ha estat durant molt de temps un repte stable diffusion. És freqüent la presència d'extremitats addicionals o que falten. Normalment, l'Inpainting s'utilitza per arreglar-los o, més recentment, podeu utilitzar la funció Open Pose de ControlNet per duplicar una posició d'una imatge de referència. Ens complau observar que aquí és on ha millorat el model SDXL Beta. El model SDXL Beta ha mostrat una millora significativa en la duplicació precisa de posicions a partir d'imatges de referència. Aquesta pot ser una eina valuosa per a diverses aplicacions com l'animació i la realitat virtual.
Estil retrat. SDXL Beta produeix retrats excel·lents que semblen fotos: és una actualització en comparació amb la versió 1.5. L'algoritme millorat de SDXL Beta millora els detalls i la precisió del color dels retrats, donant com a resultat un aspecte més natural i realista. Els usuaris també poden ajustar els nivells de nitidesa i saturació per aconseguir els efectes desitjats.
Duoton. La paraula clau duoton sempre produeix fotos en blanc i negre al model v1.5. Tanmateix, ara, les imatges de bitons produïdes per SDXL Beta vénen en una varietat de colors. Està clar que en comparació amb els models v1, la capacitat de interpretar la indicació ha millorat, donant com a resultat respostes més precises i rellevants dels models v2, convertint-los en una eina més fiable per a les tasques de processament del llenguatge natural.
Estils artístics. Hi ha hagut alguns ajustos menors, però és difícil determinar si el nou model ofereix millors resultats, ja que simplement són únics. És possible que aquests ajustos siguin una qüestió de preferència personal o d'opinió subjectiva, cosa que dificulta la realització d'a defijudici nitiu sobre la seva qualitat. No obstant això, la singularitat dels ajustos pot ser notable i val la pena explorar-la més a fons.
Conclusió
- Stable Diffusion finalment pot produir un text que tingui sentit.
- SDXL proporciona imatges més estèticament agradables que els models v2.1 i (en menor mesura) els models v1.5.
- El nou model produeix imatges més precises.
- L'anatomia humana ha millorat.
- Les indicacions negatives no són tan necessàries com a la v2.1.
- Pot crear retrats realistes.
- Algunes curiositats del model es solucionaran abans del llançament.
Llegeix més articles relacionats:
renúncia
En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.
About The Autor
Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet.
més articlesDamir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet.