Notizie Tecnologia
23 Giugno 2023

Midjourney 5.2 e Stable Diffusion Aggiornamenti SDXL 0.9 per la generazione creativa di testo in immagine

In Breve

StabilityAI ha rilasciato l'ultimo modello, Stable Diffusion SDXL 0.9, che promette una migliore percezione di istruzioni e dettagli dell'immagine migliorati.

Midjourney 5.2 introduce nuove funzionalità come Outpainting, comando /shorten, variazioni personalizzabili e trasformazione dell'immagine 1:1.

Questi aggiornamenti dovrebbero migliorare l'esperienza dell'utente e migliorare la creatività nel processo creativo.

Oggi, entrambi i principali generatori di testo in immagini hanno rilasciato aggiornamenti significativi. Maggiore precisione nella generazione di immagini realistiche da descrizioni testuali, nonché nuove funzionalità che consentono agli utenti di controllare lo stile e la composizione delle immagini generate.

Midjourney 5.2 e Stable Diffusion Aggiornamenti SDXL 0.9 per la generazione di immagini creative
Crediti: Midjourney

Nuove funzionalità in Midjourney 5.2

Oltre StabilityAIgli aggiornamenti, Midjourney ha anche introdotto interessanti funzionalità con il rilascio di Midjourney 5.2. Un'aggiunta degna di nota è la funzione Zoom indietro, che assomiglia Riempimento generativo di Adobe per Photoshop. Tuttavia, è importante notare che MidjourneyLa funzione Zoom Out di non prevede l'uso di maschere e il risultato dipende in gran parte dall'entità del parametro "do Out".

Midjourney 5.2 offre una gamma di nuove funzionalità che migliorano l'esperienza dell'utente. In particolare, il rilascio di Stable Diffusion XL 0.9 ha messo in ombra il forte aggiornamento in Midjourney, che inizialmente molti utenti hanno trascurato.

Alcune delle caratteristiche principali e dei miglioramenti in Midjourney 5.2:

  • Outpainting: gli utenti possono ora esplorare la funzione Outpainting con opzioni come 1.5, 2 e impostazioni personalizzate. Se utilizzata in modo iterativo, questa funzione produce risultati impressionanti.
  • Variazioni personalizzabili: La forza delle variazioni in Midjourney ora è personalizzabile. Gli utenti possono passare facilmente da variazioni deboli a forti selezionando due pulsanti, offrendo una maggiore flessibilità nel processo creativo.
  • Trasformazione immagine 1:1: Midjourney ora consente agli utenti di trasformare qualsiasi immagine in un quadrato con proporzioni 1:1, consentendo una perfetta integrazione in vari contesti.

Inoltre Midjourney 5.2 ha introdotto una nuova funzionalità chiamata prompt parser, rendendo ancora più semplice la generazione di immagini impressionanti. Con il comando "/shorten [your prompt]", gli utenti possono ora identificare le parole importanti ed eliminare quelle non necessarie, ottimizzando il loro richiede i migliori risultati. Il parser assegna anche pesi a ciascuna parola, consentendo agli utenti di scegliere tra cinque opzioni per il prompt più adatto. In termini più semplici, aiuta a trasformare idee vaghe in un suggerimento che si allinea meglio con le intenzioni e le esigenze degli utenti.

Quando si tratta di controllo di processo, Midjourney sta recuperando terreno rispetto alla concorrenza. Tuttavia, in termini di facilità d'uso, Midjourney resta indietro. Coloro che cercano la convenienza rispetto alla flessibilità potrebbero trovarsi attratti Adobe Lucciola, una piattaforma rivale nota per le sue caratteristiche user-friendly. D'altra parte, Stable Diffusion, con la sua natura ed estensioni open source, offre una flessibilità senza pari. Nonostante StabilityAII ritardi occasionali e le dichiarazioni ambigue come "addestrato al 50%" e "saranno disponibili a metà luglio, ma questo è impreciso", una volta che i pesi saranno disponibili, tutto si allineerà senza problemi.

Con questi progressi, Midjourney continua a fornire funzioni entusiasmanti per la generazione di immagini semplice ed efficiente. Gli utenti possono ora godere di un maggiore controllo sui loro prompt, con risultati migliori. Mentre la tecnologia continua a progredire, piattaforme come Midjourney mirano a migliorare le esperienze degli utenti e a rendere gli sforzi creativi più accessibili a tutti.

Inoltre, l'ultima versione di Midjourney enfatizza il realismo, particolarmente evidente in generazione artistica. Per evidenziare questi miglioramenti, è stato effettuato un confronto tra un prompt e un seed in Midjourney versioni 5.1 e 5.2.

Esempi appena generati da Midjourney 5.2:

Nuove funzionalità in Stable Diffusion SD XL 0.9

StabilityAI ha apportato miglioramenti con il rilascio del loro ultimo modello, Stable Diffusion SD XL 0.9. Promettono una migliore percezione di istruzioni e dettagli dell'immagine migliorati, consentendo agli utenti di creare immagini più accattivanti. Ancora meglio, puoi già provare gratuitamente il nuovo modello su Clip Drop.

Il Stable Diffusion Il modello SDXL 0.9 ha attirato l'attenzione sin dalla sua pubblicazione da parte di StabilityAI. Anche se la conferma ufficiale del rilascio è disponibile, ma il collegamento deve ancora essere fornito. Nella sua versione base, il modello SDXL 0.9 vanta ben 3.5 miliardi di parametri. Inoltre, ci sono piani per un altro insieme di due modelli, per un totale di ben 6.6 miliardi di parametri.

Per ottenere una migliore generazione di immagini, StabilityAI utilizza una concatenazione di due modelli CLIP: la base clip from OpenAI e OpenCLIP ViT-G/14. Questa fusione consente la generazione di dettagli più accurati nelle immagini. Confronti di immagini accoppiate tra il Versione beta di SDXL e la nuova versione, SDXL 0.9, dimostrano chiaramente il sostanziale miglioramento della qualità.

Vale la pena notare che l'utilizzo del modello SDXL 0.9 durante l'inferenza richiede una scheda video con almeno 16 GB di VRAM per garantire prestazioni fluide. Poiché gli utenti attendono con impazienza un post sul blog completo con tutti i dettagli e il rilascio del codice, c'è attesa per ulteriori miglioramenti e opportunità.

Esempi appena generati da SDXL 0.9:

Per saperne di più sull'intelligenza artificiale:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Altri articoli
Damir Jalalov
Damir Jalalov

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Cresce l’appetito istituzionale verso gli ETF Bitcoin in un contesto di volatilità

Le informazioni fornite tramite la documentazione 13F rivelano importanti investitori istituzionali che si dilettano negli ETF Bitcoin, sottolineando una crescente accettazione di...

Per saperne di più

Arriva il giorno della sentenza: il destino di CZ è in bilico mentre la Corte degli Stati Uniti considera l'appello del Dipartimento di Giustizia

Changpeng Zhao è pronto ad affrontare oggi la sentenza in un tribunale americano a Seattle.

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Il passaggio di Donald Trump alle criptovalute: da oppositore a sostenitore e cosa significa per il mercato statunitense delle criptovalute
Affari Mercati Storie e recensioni Tecnologia
Il passaggio di Donald Trump alle criptovalute: da oppositore a sostenitore e cosa significa per il mercato statunitense delle criptovalute
10 Maggio 2024
Layer3 lancerà il token L3 quest'estate, assegnando il 51% della fornitura totale alla comunità
Mercati Notizie Tecnologia
Layer3 lancerà il token L3 quest'estate, assegnando il 51% della fornitura totale alla comunità
10 Maggio 2024
Ultimo avvertimento di Edward Snowden agli sviluppatori Bitcoin: "Rendete la privacy una priorità a livello di protocollo o rischiate di perderla"
Mercati Sicurezza Wiki Software Storie e recensioni Tecnologia
Ultimo avvertimento di Edward Snowden agli sviluppatori Bitcoin: "Rendete la privacy una priorità a livello di protocollo o rischiate di perderla"
10 Maggio 2024
La rete Ethereum Layer 2 alimentata dall'ottimismo lancerà la sua mainnet il 15 maggio
Notizie Tecnologia
La rete Ethereum Layer 2 alimentata dall'ottimismo lancerà la sua mainnet il 15 maggio
10 Maggio 2024
LABORATORI DI CRITTOMERIA PTE. srl.