Interview Kunst SMW
01. Mai 2023

DeepFloyd und darüber hinaus: Erkundung der neuesten KI-Kunst mit dem CEO von NightCafe Studio

In Kürze

In einem exklusiven Interview gab der CEO von NightCafe Studio wertvolle Einblicke und Perspektiven zu KI-generierter Kunst.

Angus Russell stellte DeepFloyd vor – einen neuen Algorithmus, der vom Partner von NightCafe Studio entwickelt wurde. Stability AI, das im Pixelraum arbeitet und ein Large Language Model (LLM) zur Generierung von Bildern verwendet.

NightCafe-Studio ist ein KI-Kunstgenerator, mit dem Benutzer mithilfe künstlicher Intelligenz in Sekundenschnelle atemberaubende und futuristische Kunst erstellen können. Gegründet von Angus Russel Vor vier Jahren entstand NightCafe Studio aus Angus' eigener Frustration, keine Kunstwerke finden zu können, die ihn ansprachen. Angetrieben von dem Wissen, dass Stilübertragungsalgorithmen existieren, suchte er nach einer Website, die es ihm ermöglichen würde, personalisierte Kunst durch Stilübertragung zu erstellen und zu drucken. 

Zu seiner Enttäuschung konnte er eine solche Plattform nicht finden. Dieser Rückschlag entfachte jedoch eine innovative Idee in ihm. Er beschloss, eine Transfer-App im neuronalen Stil zu erstellen, um KI-generierte Kunst zu erstellen, und stellte sie auf Reddit zur Verfügung.

NightCafe Studio entstand als Plattform zur Text-zu-Bild-Generierung und ist damit die erste ihrer Art. Diese einzigartige Funktion führte zu einem erheblichen Anstieg sowohl der Einnahmen als auch der Benutzerbasis. Seitdem ist die Plattform an der Spitze der generativen KI geblieben und hat eine große Community von Enthusiasten angezogen, die den Generator gerne verwenden, um atemberaubende Kunstwerke zu erstellen. Heute gilt NightCafe Studio weithin als einer der beliebtesten und innovativsten KI-Bildgeneratoren auf dem Markt.

In einem Interview mit Angus Russell haben wir die Vorteile und Grenzen von KI-generierter Kunst, den zunehmenden Einsatz künstlicher Intelligenz in der Kunstwelt und den neuesten Algorithmus zur KI-Bilderzeugung, DeepFloyd, untersucht.

Nachtcafé-Studio
Sydney Opera House: Eines der ersten KI-generierten Bilder von Angus

Die Entstehung KI-generierter Kunst

In den letzten zehn Jahren hat die Kunstindustrie eine allmähliche Infiltration von KI und maschinellem Lernen (ML) erlebt. Diese hochmodernen Technologien haben einige faszinierende neue Konzepte eingeführt, wie Deepfakes und DALL-E , die weltweit große Aufmerksamkeit erregt haben. Heute kann es sich die Kunstindustrie nicht leisten, die immensen Auswirkungen der KI zu ignorieren, die nun eine längst überfällige Revolution in der Branche auslöst.

Angus sprach darüber, wie NightCafe Studio während der Veröffentlichung von Wachstumsspitzen erlebte Stable Diffusion, ein Text-zu-Bild-Modell, mit dem sein Unternehmen am Tag der Markteinführung live ging. Seitdem wurde die Eintrittsbarriere für die Erstellung ähnlicher Tools durch das Open-Source-Sourcing von Algorithmen und Beispielcodes gesenkt.

Der Gründer von NightCafe Studio glaubt, dass es bei der Schaffung von KI-Kunst nicht nur um das Endprodukt geht, sondern auch um den Entstehungsprozess. Er sieht es als eine Form der Therapie und Entspannung, die es den Menschen ermöglicht, sich auf einzigartige und kreative Weise auszudrücken. Viele Menschen, die sich nie für kreativ gehalten haben, haben ihre künstlerischen Fähigkeiten durch KI-generierte Bilder entdeckt. Diese Philosophie spiegelt sich in der Benutzeroberfläche der Plattform wider, die so gestaltet ist, dass sie benutzerfreundlich und für Künstler aller Erfahrungsstufen zugänglich ist. 

Allein auf NightCafe Studio gibt es bereits zwischen zwei und drei Millionen Nutzer pro Monat, die rund eine Million Bilder pro Tag generieren. Stability AI, ein Open-Source-Unternehmen für generative KI, angegeben dass sie kurz nach dem Start von über 10 Millionen Nutzer hatten, die täglich aktiv waren Stable Diffusion.

Empfohlen: Die 10+ besten KI-Kunstgeneratoren des Jahres 2023: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: Der neue bahnbrechende Algorithmus zur KI-Bilderzeugung

NightCafe Studio implementiert einen neuen Algorithmus von Stability AI namens DeepFloyd, das verspricht, die Art und Weise, wie wir Bilder mit künstlicher Intelligenz erzeugen, zu revolutionieren.

DeepFloyd, das sich derzeit in der Beta-Phase befindet, ist ein neues Text-to-Image-Modell, das beeindruckende Bilder aus Beschreibungen in natürlicher Sprache generieren kann. Es basiert auf einer neuartigen Architektur, die ein großes Sprachmodell mit drei Diffusionsmodellen kombiniert. Es ist von Imagen inspiriert, einem ähnlichen Modell, das von Google Research entwickelt, aber nie der Öffentlichkeit zugänglich gemacht wurde.

Das Modell kann klare und kohärente Bilder mit Text und Objekten in verschiedenen räumlichen Beziehungen erzeugen, was für die meisten anderen Text-zu-Bild-Modelle eine herausfordernde Aufgabe ist. Dies wird durch die Verwendung des großen Sprachmodells T5-XXL-1.1 als Textcodierer und einer erheblichen Menge von Text-Bild-Cross-Attention-Layern erreicht, die eine bessere Prompt- und Image-Allianz bieten. 

DeepFloyd kann auch Bilder mit einem nicht standardmäßigen Seitenverhältnis erstellen und hat ein hohes Maß an Fotorealismus. Darüber hinaus ermöglicht es Zero-Shot-Bild-zu-Bild-Übersetzungen, was bedeutet, dass Stil, Muster und Details eines Ausgabebilds geändert werden können, während die Grundform des Quellbilds beibehalten wird, ohne dass eine Feinabstimmung erforderlich ist.

Der neue Algorithmus funktioniert anders als Stable Diffusion. DeepFloyd verwendet Pixelraum und ein Large Language Model (LLM). Stable Diffusion nutzt latenten Raum und ein festes CLIP-Modell. DeepFloyd verwendet außerdem mehrere Diffusionsprozesse, um Bilder zu erstellen Stable Diffusion verwendet nur einen einzigen.

DeepFloyd ist der Name der Forschungsgruppe, die den Algorithmus entwickelt hat, und der Algorithmus selbst heißt IF. Zur Forschungsgruppe gehören viele der gleichen Leute, die es geschaffen haben GPT-3Vorgänger, GPT-2und ein früheres hochmodernes Sprachmodell namens RuGPT.

Einige Spekulationen deuten darauf hin, dass der Name IF von einem gleichnamigen Pink-Floyd-Song inspiriert sein könnte, wie aus dem Social-Media-Bios der Algorithmus-Forschungsgruppe hervorgeht.

Lesen Sie mehr über den Algorithmus hier.

deepfloyd nachtcafe studio
Mit DeepFloyd IF generierte Bilder. Quelle: Stability AI

Vergleich der Einschränkungen von KI-Kunst und digitaler Kunst

Eine der größten KI-Einschränkungen ist Text, obwohl DeepFloyd dieses Problem angeht. Eine weitere Einschränkung besteht darin, dass es schwierig ist, ein Bild genau so zu erhalten, wie man es sich vorgestellt hat, insbesondere ohne die Hilfe eines Experten. Der KI fehlt auch die Fähigkeit, das zu verstehen und zu interpretieren kulturelle und soziale Kontexte, die die menschliche Kunst prägen. Daher kann KI-generierte Kunst manchmal Werke hervorbringen, die fehl am Platz oder kulturell unsensibel erscheinen.

Allerdings können KI-generierte Bilder immer noch schön und manchmal sogar besser als die ursprüngliche Idee sein, solange der Benutzer offen für Überraschungen ist, sagte Angus. Außerdem gibt es Möglichkeiten, die zu ändern generierte Bilder mithilfe von KI-Algorithmen oder Photoshop. Während die Erstellung eines exakten Bildes derzeit ein Bereich aktiver Forschung ist, werden bereits erhebliche Fortschritte erzielt. Es könnte bald möglich sein, die volle Kontrolle über jeden Aspekt eines Bildes zu haben. 

Die KI stützt sich auf die Bilder und Kunstwerke, die im Internet vorhanden sind, als Inspiration, aber nur auf die, mit denen sie trainiert wurde. Verschiedene Algorithmen, wie z Midjourney, DALL-E und Stable Diffusionwerden auf verschiedenen Datensätzen trainiert, was bedeutet, dass sie bei bestimmten Bildtypen möglicherweise eine bessere Leistung erbringen. 

Kürzlich haben Forscher die Auswirkungen des Entfernens von Bildern geringer Qualität aus Trainingsdatensätzen untersucht, um die KI-Ergebnisse zu verbessern. Durch das Herausfiltern dieser Bilder mit geringer Qualität kann der resultierende Datensatz kleiner, aber qualitativ hochwertiger werden, was zu besseren Ergebnissen führt, ohne die Größe von KI-Modellen zu erhöhen oder teurere Hardware zu erfordern. Angus teilte mit, dass dieser Ansatz einen vielversprechenden Weg darstellt, um die Qualität von KI-generierten Bildern zu verbessern, ohne sich auf größere und ressourcenintensivere Modelle zu verlassen.

Ein Problem mit KI in der Kunst ist, dass sie die Arbeit menschlicher Künstler entwerten kann, die viel Zeit mit der Schaffung von Kunst verbringen, während KI in der Lage ist, Kunst in Sekundenschnelle zu erzeugen. Es gibt jedoch eine gewisse immaterielle Qualität menschlicher Kunst, die für KI möglicherweise schwer zu replizieren ist, wie z. B. die emotionale Tiefe und Komplexität, die oft in von Menschen geschaffenen Werken vorhanden ist. NightCafe Studio glaubt, dass es bei KI weniger darum geht, Kunst für kommerzielle Zwecke zu schaffen, als vielmehr darum, den kreativen Prozess selbst zu genießen.

„Von Menschen gemachte Kunst wird immer einen Wert haben, weil sie die Anstrengung und das Können des Künstlers repräsentiert, während KI-generierte Kunst nicht den gleichen inneren Wert hat.“

Sagte Angus.

Ein ethisches Problem im Zusammenhang mit KI in der Kunst ist die Verwendung öffentlicher Bilder zum Trainieren von KI-Algorithmen, die möglicherweise nicht dem Unternehmen gehören, das die KI trainiert. Obwohl derzeit keine Gesetzesverstöße vorliegen, wirft dies Fragen zur Einwilligung und zum Datenschutz auf. Open-Source-Unternehmen mögen OpenAI und DALL-E arbeiten daran, den Prozess ethischer zu gestalten, aber die Frage bleibt offen. Möglicherweise wird es in Zukunft Vorschriften für die Verwendung von Bildern zum Training von KI in der Kunst geben.

Trotz dieser Bedenken glaubt Angus, dass sich der Prozess der KI in der Kunst nicht grundlegend von menschlichen Künstlern unterscheidet, die sich von der Arbeit anderer Künstler inspirieren lassen. Die KI weiß, wie die Dinge aussehen, und erinnert sich an Teile von Bildern, genau wie Menschen. Es ist einfach besser, sie von Grund auf neu zu erstellen.

Mehr lesen:

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Agne ist eine Journalistin, die über die neuesten Trends und Entwicklungen im Metaversum, in der KI und anderen Bereichen berichtet Web3 Branchen für die Metaverse Post. Ihre Leidenschaft für das Geschichtenerzählen hat sie dazu geführt, zahlreiche Interviews mit Experten auf diesen Gebieten zu führen, immer auf der Suche nach spannenden und fesselnden Geschichten. Agne hat einen Bachelor-Abschluss in Literatur und verfügt über umfangreiche Erfahrung im Schreiben über ein breites Themenspektrum, darunter Reisen, Kunst und Kultur. Sie war außerdem ehrenamtlich als Redakteurin für die Tierrechtsorganisation tätig und half dabei, das Bewusstsein für Tierschutzthemen zu schärfen. Kontaktieren Sie sie unter [E-Mail geschützt] .

Weitere Artikel
Agne Cimerman
Agne Cimerman

Agne ist eine Journalistin, die über die neuesten Trends und Entwicklungen im Metaversum, in der KI und anderen Bereichen berichtet Web3 Branchen für die Metaverse Post. Ihre Leidenschaft für das Geschichtenerzählen hat sie dazu geführt, zahlreiche Interviews mit Experten auf diesen Gebieten zu führen, immer auf der Suche nach spannenden und fesselnden Geschichten. Agne hat einen Bachelor-Abschluss in Literatur und verfügt über umfangreiche Erfahrung im Schreiben über ein breites Themenspektrum, darunter Reisen, Kunst und Kultur. Sie war außerdem ehrenamtlich als Redakteurin für die Tierrechtsorganisation tätig und half dabei, das Bewusstsein für Tierschutzthemen zu schärfen. Kontaktieren Sie sie unter [E-Mail geschützt] .

Angesichts der Volatilität wächst der institutionelle Appetit auf Bitcoin-ETFs

Offenlegungen in 13F-Anmeldungen zeigen, dass namhafte institutionelle Anleger sich mit Bitcoin-ETFs beschäftigen, was die wachsende Akzeptanz von ... unterstreicht.

Weitere Informationen

Der Tag der Verurteilung steht vor der Tür: Das Schicksal von CZ bleibt ungewiss, während das US-Gericht den Plädoyer des DOJ prüft

Changpeng Zhao steht heute vor einer Verurteilung vor einem US-Gericht in Seattle.

Weitere Informationen
Treten Sie unserer innovativen Tech-Community bei
Weiterlesen
Lesen Sie weiter
Injective schließt sich mit AltLayer zusammen, um inEVM erneut Sicherheit zu bieten
Geschäft Nachrichtenbericht Technologie
Injective schließt sich mit AltLayer zusammen, um inEVM erneut Sicherheit zu bieten
3. Mai 2024
Masa arbeitet mit Teller zusammen, um den MASA-Kreditpool einzuführen, der die USDC-Kreditaufnahme auf Basis ermöglicht
Märkte Nachrichtenbericht Technologie
Masa arbeitet mit Teller zusammen, um den MASA-Kreditpool einzuführen, der die USDC-Kreditaufnahme auf Basis ermöglicht
3. Mai 2024
Velodrome bringt in den kommenden Wochen die Beta-Version von Superchain auf den Markt und weitet sich auf OP-Stack-Layer-2-Blockchains aus
Märkte Nachrichtenbericht Technologie
Velodrome bringt in den kommenden Wochen die Beta-Version von Superchain auf den Markt und weitet sich auf OP-Stack-Layer-2-Blockchains aus
3. Mai 2024
CARV gibt Partnerschaft mit Aethir bekannt, um seine Datenschicht zu dezentralisieren und Belohnungen zu verteilen
Geschäft Nachrichtenbericht Technologie
CARV gibt Partnerschaft mit Aethir bekannt, um seine Datenschicht zu dezentralisieren und Belohnungen zu verteilen
3. Mai 2024