Notizie Tecnologia
Gennaio 24, 2023

StyleGAN-T: la generazione di testo in immagine più veloce che produce risultati in meno di 0.1 secondi

In Breve

StyleGAN-T è un nuovo GAN per la generazione di tex2image.

Questo GAN produce buoni risultati ed è anche abbastanza veloce (0.1 sec per un'immagine 512×512).

La nuova architettura è basata su StyleGAN-XL, ma rivaluta i design del generatore e del discriminatore.

Avrai sicuramente notato che i GAN non vengono più discussi quando viene fuori l'argomento della generazione di immagini. Dopo modelli di diffusione come Stable Diffusion emersi, i GAN in qualche modo si sono ritirati in secondo piano. Questo perché sono difficili da addestrare e spesso inciampano. L'unico vantaggio dei GAN era che, a differenza dei modelli di diffusione, producono un'immagine in una singola corsa (un "forward pass") invece di molte corse.

StyleGAN-T: la più veloce generazione di testo in immagine in meno di 0.1 secondi

Ma ora è entrato in campo un nuovo giocatore dei GAN: StileGAN-T. Questo GAN per la generazione da testo a immagine produce rapidamente buoni risultati, poiché richiede solo 0.1 secondi per un'immagine 512×512. La nuova architettura è basata su StyleGAN-XL, ma rivaluta i design del generatore e del discriminatore e utilizza CLIP per l'allineamento del prompt del testo e la grafica generata.

Articolo correlato: VToonify: un modello AI in tempo reale per la generazione di video di ritratti artistici

In generale, StyleGAN-T ora crea testo in immagine più velocemente e con maggiore precisione rispetto ad altri GAN. Tuttavia, GAN è ancora pessimo e la qualità del modello SD a grandezza naturale è ovviamente fuori discussione. Ma tutto dipenderà dalla capacità di produrre immagini di altissima qualità dal testo in meno di un secondo in un anno. Inoltre, cadrà da qualche parte tra GAN e modello di diffusione.

Stile Architettura GAN-T
Stile Architettura GAN-T

Per saperne di più sull'intelligenza artificiale:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Altri articoli
Damir Jalalov
Damir Jalalov

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Hot Stories
Iscriviti alla nostra newsletter.
Notizie

Arriva il giorno della sentenza: il destino di CZ è in bilico mentre la Corte degli Stati Uniti considera l'appello del Dipartimento di Giustizia

Changpeng Zhao è pronto ad affrontare oggi la sentenza in un tribunale americano a Seattle.

Per saperne di più

I fondatori di Samourai Wallet sono accusati di aver facilitato 2 miliardi di dollari in affari nel Darknet

L'apprensione dei fondatori di Samourai Wallet rappresenta una notevole battuta d'arresto per il settore, sottolineando la persistente ...

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Pantera Capital investe in TON Blockchain ed esprime fiducia nel potenziale di Telegram di ampliare l'accessibilità alle criptovalute
Affari Notizie Tecnologia
Pantera Capital investe in TON Blockchain ed esprime fiducia nel potenziale di Telegram di ampliare l'accessibilità alle criptovalute
2 Maggio 2024
Mitosis raccoglie 7 milioni di dollari in finanziamenti da Amber Group e Foresight Ventures per portare avanti il ​​suo protocollo di liquidità modulare
Affari Notizie Tecnologia
Mitosis raccoglie 7 milioni di dollari in finanziamenti da Amber Group e Foresight Ventures per portare avanti il ​​suo protocollo di liquidità modulare
2 Maggio 2024
Galxe collabora con Jambo per espandere l'accessibilità globale a Web3
Affari Notizie Tecnologia
Galxe collabora con Jambo per espandere l'accessibilità globale a Web3
2 Maggio 2024
Med-Gemini di Google è pronto a dare un vantaggio GPT-4 Con le sue prestazioni superiori nel settore sanitario
AI Wiki Notizie Software Tecnologia
Med-Gemini di Google è pronto a dare un vantaggio GPT-4 Con le sue prestazioni superiori nel settore sanitario
2 Maggio 2024
LABORATORI DI CRITTOMERIA PTE. srl.