Notizie Tecnologia
10 aprile 2023

Stability AI Rilascia un nuovo modello chiamato SDXL Beta

In Breve

Stability AI ha rilasciato un nuovo modello chiamato SDXL Beta (Stable Diffusion XL beta). È un modello più grande con più parametri e alcuni miglioramenti sconosciuti. È disponibile su DreamStudio, Stability AIIl generatore di immagini ufficiale di e utilizza algoritmi avanzati e tecniche di deep learning per creare immagini straordinarie.

Stability AI ha svelato in anteprima un nuovo modello chiamato SDXL Beta, abbreviazione di Stable Diffusion Beta XL. Finora, la società non ha condiviso molte informazioni sul modello, ma è disponibile per il test per chiunque lo desideri. Per cosa c'è di nuovo in questo modello SDXL stable diffusion? Quali sono i suoi vantaggi e svantaggi? Indaghiamo.

Leggi di più: Midjourney e Dall-E Artist Styles Dump con esempi: 130 famose tecniche di pittura AI

Cos'è esattamente il modello SDXL?

Il modello SDXL è un nuovo modello che è attualmente essere addestrato. È ben lungi dall'essere finito e, quando verrà rilasciato, molti dettagli potrebbero cambiare; per quanto ne sappiamo, potrebbe non essere nemmeno chiamato il modello SDXL. Tutto quello che sappiamo è che si tratta di un modello più grande con più parametri e alcuni miglioramenti sconosciuti. È un modello v2, non un modello v3 (qualunque cosa significhi). È possibile che i miglioramenti nel modello v2 possano migliorare le prestazioni del sistema, ma senza ulteriori informazioni è difficile determinare quanto significativi possano essere questi miglioramenti. Inoltre, sarebbe utile sapere quali parametri specifici sono stati aggiunti o regolati in questa versione.

Il modello SDXL è attualmente disponibile presso DreamStudio, Stability AIgeneratore di immagini ufficiale di. Seleziona SDXL Beta dal menu del modello per verificarlo. Sembra utilizzare algoritmi avanzati e tecniche di apprendimento profondo per creare effetti visivi straordinari perfetti per un'ampia gamma di applicazioni.

Cos'è esattamente il modello SDXL?

miglioramenti

Testo leggibile. SDXL è in grado di generare testo leggibile ed è probabilmente la sua caratteristica più sorprendente in quanto non era possibile nei modelli v1 e v2.1 esistenti. Il testo generato da SDXL non è sempre accurato, come puoi vedere nel file Stable Diffusion Testo sotto. Tuttavia, è di gran lunga superiore alla v2.1, per non parlare del modello v1. Questo perché SDXL utilizza un algoritmo di deep learning più avanzato che gli consente di comprendere e generare strutture linguistiche più complesse. Con ulteriori sviluppi, ha il potenziale per diventare ancora più preciso e affidabile.

Prompt: foto di un signore con in mano un foglio bianco che dice "No Fakes"
Prompt: foto di un signore con in mano un foglio bianco che dice "No Fakes"
Foto di una donna dai capelli rossi con un cartello nero con caratteri bianchi che dice "Niente scherzi"
Prompt: foto di una donna dai capelli rossi con in mano un cartello nero con caratteri bianchi che dice "No Jokes"
Prompt: Foto di una donna cinese seduta in un cinema con in mano un piatto con la parola "Pain and Plane" scritta sopra.
Suggerimento: foto di una donna cinese seduta in un cinema con in mano un piatto con la parola "Pain and Plane" scritta sopra.

Anatomia umana. La generazione accurata di figure umane anatomicamente corrette è stata a lungo una sfida per stable diffusion. La presenza di arti aggiuntivi o mancanti è comune. Inpainting viene in genere utilizzato per correggerli o, più recentemente, è possibile utilizzare la funzione Open Pose di ControlNet per duplicare una posa da un'immagine di riferimento. Siamo lieti di notare che qui è dove il modello SDXL Beta è migliorato. Il modello SDXL Beta ha mostrato un miglioramento significativo nella duplicazione accurata delle pose dalle immagini di riferimento. Questo può essere uno strumento prezioso per varie applicazioni come l'animazione e la realtà virtuale.

Foto di una donna in tenuta sportiva che fa girare la palla nella mano destra
Suggerimento: foto di una donna in tenuta sportiva che fa girare la palla con la mano destra
Foto di un ragazzo seduto sotto la luna rossa
Prompt: Foto di un ragazzo seduto sotto la luna rossa
Suggerimento: una foto mostra un uomo anziano che corre nella foresta.

Stile ritratto. SDXL Beta produce ritratti eccellenti che sembrano foto: è un aggiornamento rispetto alla versione 1.5. L'algoritmo migliorato in SDXL Beta migliora i dettagli e la precisione del colore dei ritratti, risultando in un aspetto più naturale e realistico. Gli utenti possono anche regolare i livelli di nitidezza e saturazione per ottenere gli effetti desiderati.

Prompt: una foto di un ragazzo e una ragazza
Prompt: una foto di un ragazzo e una ragazza
Suggerimento: una foto ritratto di un ragazzo grasso
Suggerimento: una foto ritratto di un ragazzo grasso
Prompt: uno scatto fotografico di una donna degli anni '80
Prompt: uno scatto fotografico di una donna degli anni '80

Bicromia. La parola chiave duotone produce sempre foto in bianco e nero nel modello v1.5. Tuttavia, ora le immagini a due tonalità prodotte da SDXL Beta sono disponibili in una varietà di colori. È chiaro che rispetto ai modelli v1, la capacità di interpretare il prompt è migliorato, ottenendo risposte più accurate e pertinenti dai modelli v2, rendendoli uno strumento più affidabile per le attività di elaborazione del linguaggio naturale.

ritratto in stile duotone di un cane
Prompt: ritratto in stile bicromia di un cane
paesaggio a due tonalità dell'isola
Prompt: paesaggio a due tonalità dell'isola
ritratto a due tonalità di giovane donna africana
Prompt: ritratto a due tonalità di giovane donna africana

Stili artistici. Ci sono stati alcuni aggiustamenti minori, ma è difficile determinare se il nuovo modello fornisce risultati migliori in quanto sono semplicemente unici. È possibile che questi aggiustamenti possano essere una questione di preferenza personale o opinione soggettiva, rendendo difficile fare a defigiudizio nitivo sulla loro qualità. Tuttavia, l'unicità delle regolazioni può essere degna di nota e merita di essere esplorata ulteriormente.

New York di Ivan Aivazovsky
v 1.5: New York di Ivan Aivazovsky
New York di Ivan Aivazovsky
SDXL: New York di Ivan Aivazovsky
La vecchia foresta di Christopher Balaskas
v 1.5: Old Forest di Christopher Balaskas
La vecchia foresta di Christopher Balaskas
SDXL: Old Forest di Christopher Balaskas

Conclusione

  • Stable Diffusion può finalmente produrre un testo che abbia un senso.
  • SDXL fornisce immagini esteticamente più gradevoli rispetto ai modelli v2.1 e (in misura minore) v1.5.
  • Il nuovo modello produce immagini più accurate.
  • L'anatomia umana è migliorata.
  • I prompt negativi non sono così necessari come nella versione 2.1.
  • Può creare ritratti realistici.
  • Alcune stranezze nel modello verranno corrette prima del rilascio.

Leggi altri articoli correlati:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Altri articoli
Damir Jalalov
Damir Jalalov

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Arriva il giorno della sentenza: il destino di CZ è in bilico mentre la Corte degli Stati Uniti considera l'appello del Dipartimento di Giustizia

Changpeng Zhao è pronto ad affrontare oggi la sentenza in un tribunale americano a Seattle.

Per saperne di più

I fondatori di Samourai Wallet sono accusati di aver facilitato 2 miliardi di dollari in affari nel Darknet

L'apprensione dei fondatori di Samourai Wallet rappresenta una notevole battuta d'arresto per il settore, sottolineando la persistente ...

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Il prezzo del Bitcoin scende in vista dell'annuncio della decisione sul tasso di interesse della Federal Reserve, gli analisti avvertono di un potenziale cambiamento del mercato
Mercati Notizie Tecnologia
Il prezzo del Bitcoin scende in vista dell'annuncio della decisione sul tasso di interesse della Federal Reserve, gli analisti avvertono di un potenziale cambiamento del mercato
1 Maggio 2024
PlayFi integra MultiversX per il plug-and-play Web3 Esperienza di gioco
Affari Notizie Tecnologia
PlayFi integra MultiversX per il plug-and-play Web3 Esperienza di gioco
1 Maggio 2024
Galxe presenta Passport V2 con strumenti di verifica e privacy migliorati per Web3
Notizie Tecnologia
Galxe presenta Passport V2 con strumenti di verifica e privacy migliorati per Web3
30 aprile 2024
Da 32 ETH a 1 milione di validatori: il ruolo di Lido Finance nella democratizzazione dello staking di Ethereum
Software Storie e recensioni Tecnologia
Da 32 ETH a 1 milione di validatori: il ruolo di Lido Finance nella democratizzazione dello staking di Ethereum
30 aprile 2024
LABORATORI DI CRITTOMERIA PTE. srl.