Nachrichtenbericht Technologie
24. Januar 2023

StyleGAN-T: Die schnellste Text-zu-Bild-Generierung, die Ergebnisse in weniger als 0.1 Sekunden liefert

In Kürze

StyleGAN-T ist ein neues GAN für die tex2image-Generierung.

Dieses GAN liefert gute Ergebnisse und ist sogar ziemlich schnell (0.1 Sek. für ein 512×512-Bild).

Die neue Architektur basiert auf StyleGAN-XL, bewertet aber die Generator- und Diskriminatordesigns neu.

Sie haben sicherlich bemerkt, dass GANs nicht mehr diskutiert werden, wenn es um das Thema Bilderzeugung geht. Nach Diffusionsmodellen wie Stable Diffusion auftauchten, zogen sich GANs irgendwie in den Hintergrund zurück. Das liegt daran, dass sie schwierig zu trainieren sind und häufig darüber stolpern. Der einzige Vorteil von GANs bestand darin, dass sie im Gegensatz zu Diffusionsmodellen ein Bild in einem einzigen Durchlauf (einem „Vorwärtsdurchlauf“) statt in vielen Durchläufen erzeugen.

StyleGAN-T: Die schnellste Text-zu-Bild-Generierung in weniger als 0.1 Sekunde

Doch nun betritt ein neuer Spieler von den GANs das Feld: StilGAN-T. Dieses GAN für die Text-zu-Bild-Generierung liefert schnell gute Ergebnisse, da es nur 0.1 Sekunden für ein 512 × 512-Bild benötigt. Die neue Architektur basiert auf StyleGAN-XL, bewertet aber die Generator- und Diskriminator-Designs neu und verwendet CLIP für die Ausrichtung von Texteingabeaufforderungen und generierten Grafiken.

In Verbindung stehender Artikel: VToonify: Ein Echtzeit-KI-Modell zur Erstellung künstlerischer Porträtvideos

Im Allgemeinen erstellt StyleGAN-T Text-zu-Bild jetzt schneller und genauer als andere GANs. Allerdings ist GAN immer noch schrecklich und die Qualität des SD-Modells in voller Größe steht offensichtlich außer Frage. Aber das hängt alles von der Fähigkeit ab, in weniger als einer Sekunde pro Jahr aus Text extrem hochwertige Bilder zu erzeugen. Darüber hinaus wird es irgendwo zwischen GAN und dem liegen Diffusionsmodell.

StyleGAN-T-Architektur
StyleGAN-T-Architektur

Lesen Sie mehr über KI:

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Weitere Artikel
Damir Jalalow
Damir Jalalow

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Hot Stories
Abonnieren Sie unseren Newsletter.
Aktuelles

Der Tag der Verurteilung steht vor der Tür: Das Schicksal von CZ bleibt ungewiss, während das US-Gericht den Plädoyer des DOJ prüft

Changpeng Zhao steht heute vor einer Verurteilung vor einem US-Gericht in Seattle.

Weitere Informationen

Den Gründern von Samourai Wallet wird vorgeworfen, Darknet-Deals im Wert von 2 Milliarden US-Dollar ermöglicht zu haben

Die Besorgnis der Samourai Wallet-Gründer stellt einen bemerkenswerten Rückschlag für die Branche dar und unterstreicht die anhaltende ...

Weitere Informationen
Treten Sie unserer innovativen Tech-Community bei
Weiterlesen
Lesen Sie weiter
Pantera Capital investiert in die TON-Blockchain und zeigt sich zuversichtlich, dass Telegram das Potenzial hat, die Zugänglichkeit von Kryptowährungen zu erweitern
Geschäft Nachrichtenbericht Technologie
Pantera Capital investiert in die TON-Blockchain und zeigt sich zuversichtlich, dass Telegram das Potenzial hat, die Zugänglichkeit von Kryptowährungen zu erweitern
2. Mai 2024
Mitosis erhält 7 Millionen US-Dollar an Finanzmitteln von der Amber Group und Foresight Ventures, um sein modulares Liquiditätsprotokoll voranzutreiben
Geschäft Nachrichtenbericht Technologie
Mitosis erhält 7 Millionen US-Dollar an Finanzmitteln von der Amber Group und Foresight Ventures, um sein modulares Liquiditätsprotokoll voranzutreiben
2. Mai 2024
Galxe arbeitet mit Jambo zusammen, um die globale Zugänglichkeit zu erweitern Web3
Geschäft Nachrichtenbericht Technologie
Galxe arbeitet mit Jambo zusammen, um die globale Zugänglichkeit zu erweitern Web3
2. Mai 2024
Googles Med-Gemini ist bereit, einen Vorsprung zu verschaffen GPT-4 Mit seiner überlegenen Leistung im Gesundheitswesen
AI Wiki Aktuelles Software Technologie
Googles Med-Gemini ist bereit, einen Vorsprung zu verschaffen GPT-4 Mit seiner überlegenen Leistung im Gesundheitswesen
2. Mai 2024