Informe de notícies Tecnologia
Abril 10, 2023

Stability AI Llança un nou model anomenat SDXL Beta

En breu

Stability AI ha llançat un nou model anomenat SDXL Beta (Stable Diffusion XL Beta). És un model més gran amb més paràmetres i algunes millores desconegudes. Està disponible a DreamStudio, Stability AIés el generador oficial d'imatges de , i utilitza algorismes avançats i tècniques d'aprenentatge profund per crear imatges impressionants.

Stability AI ha presentat una vista prèvia d'un nou model anomenat SDXL Beta, abreviatura de Stable Diffusion XL Beta. Fins ara, l'empresa no ha compartit molta informació sobre el model, però està disponible per provar-ho per a qualsevol persona que ho vulgui fer. Què té de nou aquest model SDXL? stable diffusion? Quins són els seus avantatges i inconvenients? Investiguem.

Llegir més: Midjourney Abocador d'estils d'artista i Dall-E amb exemples: 130 tècniques de pintura famoses amb IA

Què és exactament el model SDXL?

El model SDXL és un model nou que hi ha actualment sent entrenat. Està lluny d'haver-se acabat, i quan s'estreni, molts detalls al respecte poden canviar; pel que sabem, potser ni tan sols es diu el model SDXL. Tot el que sabem és que és un model més gran amb més paràmetres i algunes millores desconegudes. És un model v2, no un model v3 (sigui el que signifiqui). És possible que les millores del model v2 puguin millorar el rendiment del sistema, però sense més informació, és difícil determinar la importància d'aquestes millores. A més, seria útil saber quins paràmetres específics s'han afegit o ajustat en aquesta versió.

El model SDXL està disponible actualment a DreamStudio, Stability AIel generador d'imatges oficial de. Seleccioneu SDXL Beta al menú del model per comprovar-ho. Sembla que utilitza algorismes avançats i tècniques d'aprenentatge profund per crear imatges impressionants que són perfectes per a una àmplia gamma d'aplicacions.

Què és exactament el model SDXL?

Millores

Text llegible. SDXL és capaç de generar text llegible i probablement és la seva característica més sorprenent, ja que no era possible als models v1 i v2.1 existents. El text generat per SDXL no sempre és precís, com podeu veure a Stable Diffusion Text a continuació. Tanmateix, és molt superior al model v2.1, i molt menys al model v1. Això es deu al fet que SDXLs utilitza un algorisme d'aprenentatge profund més avançat que li permet entendre i generar estructures de llenguatge més complexes. Amb un desenvolupament posterior, té el potencial de ser encara més precís i fiable.

Avís: foto d'un senyor sostenint un paper blanc que diu "No falsificacions"
Avís: foto d'un senyor sostenint un paper blanc que diu "No falsificacions"
Foto d'una dona pèl-roja sostenint un rètol negre amb fonts blanques que diu "No hi ha bromes".
Avís: foto d'una dona pèl-roja que sosté un cartell negre amb fonts blanques que diu "No hi ha bromes"
Avís: foto d'una dona xinesa asseguda en un cinema sostenint un plat amb la paraula "Dolor i avió" escrita.
Avís: foto d'una dona xinesa asseguda en un cinema sostenint un plat amb la paraula "Dolor i avió" escrita.

Anatomia humana. La generació precisa de figures humanes anatòmicament correctes ha estat durant molt de temps un repte stable diffusion. És freqüent la presència d'extremitats addicionals o que falten. Normalment, l'Inpainting s'utilitza per arreglar-los o, més recentment, podeu utilitzar la funció Open Pose de ControlNet per duplicar una posició d'una imatge de referència. Ens complau observar que aquí és on ha millorat el model SDXL Beta. El model SDXL Beta ha mostrat una millora significativa en la duplicació precisa de posicions a partir d'imatges de referència. Aquesta pot ser una eina valuosa per a diverses aplicacions com l'animació i la realitat virtual.

Foto d'una dona amb un vestit esportiu fent girar la pilota a la mà dreta
Avís: foto d'una dona amb un vestit esportiu fent girar la pilota a la mà dreta
Foto d'un nen assegut sota la lluna vermella
Avís: foto d'un nen assegut sota la lluna vermella
Avís: una foto mostra un vell corrent al bosc.

Estil retrat. SDXL Beta produeix retrats excel·lents que semblen fotos: és una actualització en comparació amb la versió 1.5. L'algoritme millorat de SDXL Beta millora els detalls i la precisió del color dels retrats, donant com a resultat un aspecte més natural i realista. Els usuaris també poden ajustar els nivells de nitidesa i saturació per aconseguir els efectes desitjats.

Avís: una imatge d'un nen i una nena
Avís: una imatge d'un nen i una nena
Avís: una foto de retrat d'un noi gros
Avís: una foto de retrat d'un noi gros
Avís: fotografia d'una dona dels anys 80
Avís: fotografia d'una dona dels anys 80

Duoton. La paraula clau duoton sempre produeix fotos en blanc i negre al model v1.5. Tanmateix, ara, les imatges de bitons produïdes per SDXL Beta vénen en una varietat de colors. Està clar que en comparació amb els models v1, la capacitat de interpretar la indicació ha millorat, donant com a resultat respostes més precises i rellevants dels models v2, convertint-los en una eina més fiable per a les tasques de processament del llenguatge natural.

retrat d'un gos a l'estil duoton
Avís: retrat d'un gos d'estil biton
paisatge duoton de l'illa
Avís: paisatge duoton de l'illa
retrat en dos tons d'una jove africana
Avís: retrat en dos tons d'una jove africana

Estils artístics. Hi ha hagut alguns ajustos menors, però és difícil determinar si el nou model ofereix millors resultats, ja que simplement són únics. És possible que aquests ajustos siguin una qüestió de preferència personal o d'opinió subjectiva, cosa que dificulta la realització d'a defijudici nitiu sobre la seva qualitat. No obstant això, la singularitat dels ajustos pot ser notable i val la pena explorar-la més a fons.

Nova York d'Ivan Aivazovsky
v 1.5: Nova York d'Ivan Aivazovsky
Nova York d'Ivan Aivazovsky
SDXL: Nova York d'Ivan Aivazovsky
Bosc Vell de Christopher Balaskas
v 1.5: Bosc Vell de Christopher Balaskas
Bosc Vell de Christopher Balaskas
SDXL: Bosc Vell de Christopher Balaskas

Conclusió

  • Stable Diffusion finalment pot produir un text que tingui sentit.
  • SDXL proporciona imatges més estèticament agradables que els models v2.1 i (en menor mesura) els models v1.5.
  • El nou model produeix imatges més precises.
  • L'anatomia humana ha millorat.
  • Les indicacions negatives no són tan necessàries com a la v2.1.
  • Pot crear retrats realistes.
  • Algunes curiositats del model es solucionaran abans del llançament.

Llegeix més articles relacionats:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

més articles
Damir Yalalov
Damir Yalalov

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

Hot Stories
Uneix-te al nostre butlletí.
Últimes notícies

Arriba el dia de la sentència: el destí de CZ està en equilibri mentre el tribunal nord-americà considera la petició del DOJ

Changpeng Zhao està a punt d'enfrontar-se avui a la sentència en un tribunal dels Estats Units a Seattle.

saber Més

Fundadors de Samourai Wallet acusats de facilitar 2 milions de dòlars en ofertes de Darknet

L'aprehensió dels fundadors de Samourai Wallet representa un revés notable per a la indústria, subratllant la persistent ...

saber Més
Uneix-te a la nostra comunitat tecnològica innovadora
Més...
Llegeix més
Ankr col·labora amb AI Blockchain Platform Talus Network per desbloquejar Bitcoin Liquidity per a AI
Negocis Informe de notícies Tecnologia
Ankr col·labora amb AI Blockchain Platform Talus Network per desbloquejar Bitcoin Liquidity per a AI
Pot 1, 2024
Binance Labs admet Movement Labs per facilitar la integració de Move de Facebook a través de Blockchains
Negocis Informe de notícies Tecnologia
Binance Labs admet Movement Labs per facilitar la integració de Move de Facebook a través de Blockchains
Pot 1, 2024
Solució de comerç de monedes estables de BRICS Nations Eye
Negocis mercats Històries i ressenyes Tecnologia
Solució de comerç de monedes estables de BRICS Nations Eye
Pot 1, 2024
Bitcoin L2 Network BOB s'integra amb LayerZero per a una funcionalitat millorada
Negocis Informe de notícies Tecnologia
Bitcoin L2 Network BOB s'integra amb LayerZero per a una funcionalitat millorada
Pot 1, 2024
CRYPTOMERIA LABS PTE. LTD.