Stability AI Rilascia un nuovo modello chiamato SDXL Beta
In Breve
Stability AI ha rilasciato un nuovo modello chiamato SDXL Beta (Stable Diffusion XL beta). È un modello più grande con più parametri e alcuni miglioramenti sconosciuti. È disponibile su DreamStudio, Stability AIIl generatore di immagini ufficiale di e utilizza algoritmi avanzati e tecniche di deep learning per creare immagini straordinarie.
Stability AI ha svelato in anteprima un nuovo modello chiamato SDXL Beta, abbreviazione di Stable Diffusion Beta XL. Finora, la società non ha condiviso molte informazioni sul modello, ma è disponibile per il test per chiunque lo desideri. Per cosa c'è di nuovo in questo modello SDXL stable diffusion? Quali sono i suoi vantaggi e svantaggi? Indaghiamo.
Cos'è esattamente il modello SDXL?
Il modello SDXL è un nuovo modello che è attualmente essere addestrato. È ben lungi dall'essere finito e, quando verrà rilasciato, molti dettagli potrebbero cambiare; per quanto ne sappiamo, potrebbe non essere nemmeno chiamato il modello SDXL. Tutto quello che sappiamo è che si tratta di un modello più grande con più parametri e alcuni miglioramenti sconosciuti. È un modello v2, non un modello v3 (qualunque cosa significhi). È possibile che i miglioramenti nel modello v2 possano migliorare le prestazioni del sistema, ma senza ulteriori informazioni è difficile determinare quanto significativi possano essere questi miglioramenti. Inoltre, sarebbe utile sapere quali parametri specifici sono stati aggiunti o regolati in questa versione.
Il modello SDXL è attualmente disponibile presso DreamStudio, Stability AIgeneratore di immagini ufficiale di. Seleziona SDXL Beta dal menu del modello per verificarlo. Sembra utilizzare algoritmi avanzati e tecniche di apprendimento profondo per creare effetti visivi straordinari perfetti per un'ampia gamma di applicazioni.
miglioramenti
Testo leggibile. SDXL è in grado di generare testo leggibile ed è probabilmente la sua caratteristica più sorprendente in quanto non era possibile nei modelli v1 e v2.1 esistenti. Il testo generato da SDXL non è sempre accurato, come puoi vedere nel file Stable Diffusion Testo sotto. Tuttavia, è di gran lunga superiore alla v2.1, per non parlare del modello v1. Questo perché SDXL utilizza un algoritmo di deep learning più avanzato che gli consente di comprendere e generare strutture linguistiche più complesse. Con ulteriori sviluppi, ha il potenziale per diventare ancora più preciso e affidabile.
Anatomia umana. La generazione accurata di figure umane anatomicamente corrette è stata a lungo una sfida per stable diffusion. La presenza di arti aggiuntivi o mancanti è comune. Inpainting viene in genere utilizzato per correggerli o, più recentemente, è possibile utilizzare la funzione Open Pose di ControlNet per duplicare una posa da un'immagine di riferimento. Siamo lieti di notare che qui è dove il modello SDXL Beta è migliorato. Il modello SDXL Beta ha mostrato un miglioramento significativo nella duplicazione accurata delle pose dalle immagini di riferimento. Questo può essere uno strumento prezioso per varie applicazioni come l'animazione e la realtà virtuale.
Stile ritratto. SDXL Beta produce ritratti eccellenti che sembrano foto: è un aggiornamento rispetto alla versione 1.5. L'algoritmo migliorato in SDXL Beta migliora i dettagli e la precisione del colore dei ritratti, risultando in un aspetto più naturale e realistico. Gli utenti possono anche regolare i livelli di nitidezza e saturazione per ottenere gli effetti desiderati.
Bicromia. La parola chiave duotone produce sempre foto in bianco e nero nel modello v1.5. Tuttavia, ora le immagini a due tonalità prodotte da SDXL Beta sono disponibili in una varietà di colori. È chiaro che rispetto ai modelli v1, la capacità di interpretare il prompt è migliorato, ottenendo risposte più accurate e pertinenti dai modelli v2, rendendoli uno strumento più affidabile per le attività di elaborazione del linguaggio naturale.
Stili artistici. Ci sono stati alcuni aggiustamenti minori, ma è difficile determinare se il nuovo modello fornisce risultati migliori in quanto sono semplicemente unici. È possibile che questi aggiustamenti possano essere una questione di preferenza personale o opinione soggettiva, rendendo difficile fare a defigiudizio nitivo sulla loro qualità. Tuttavia, l'unicità delle regolazioni può essere degna di nota e merita di essere esplorata ulteriormente.
Conclusione
- Stable Diffusion può finalmente produrre un testo che abbia un senso.
- SDXL fornisce immagini esteticamente più gradevoli rispetto ai modelli v2.1 e (in misura minore) v1.5.
- Il nuovo modello produce immagini più accurate.
- L'anatomia umana è migliorata.
- I prompt negativi non sono così necessari come nella versione 2.1.
- Può creare ritratti realistici.
- Alcune stranezze nel modello verranno corrette prima del rilascio.
Leggi altri articoli correlati:
Negazione di responsabilità
In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.
Circa l'autore
Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet.
Altri articoliDamir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet.