AI Wiki Kunst Technologie
02. Oktober 2023

Dall-E 3 vs. Midjourney: Ein großer Vergleich der fortschrittlichsten KI-Kunstgeneratoren

Begleiten Sie uns auf dieser aufregenden Reise, während wir Dall-E 3 und erkunden MidjourneyFeinheiten, Komplexitäten und ungenutztes Potenzial. Dieser Artikel beleuchtet die faszinierendsten Vergleiche, die auf Untersuchungen der KI-Enthusiastin Atachkina basieren. Wenn Sie mehr erfahren möchten, klicken Sie auf Link.

Dall-E 3 vs. Midjourney: Ein großer Vergleich der fortschrittlichsten KI-Kunstgeneratoren
Pro Tipps
1. Entdecken Sie die Die 50 besten Text-zu-Bild-Eingabeaufforderungen für KI-Kunstgeneratoren Midjourney und DALL-E.
2. Entfachen Sie Ihre Kreativität mit dem Die 20 besten KI-Text-zu-Bild-Kunstgeneratoren von 2023.

Dieser Artikel enthält eine Text-zu-Bild-Eingabeaufforderung, ein Bild mit den Ergebnissen von Dall-E 3 und Midjourneyund eine Erklärung der Unterschiede zwischen den beiden Kunstgeneratoren. Lass uns anfangen.

Eingabeaufforderung: Ein Raumfahrer steht auf dem Jupiter und beobachtet den Sonnenaufgang. futuristische Benutzeroberfläche, Ego-Perspektive, Space Commander, Regenmesser und HUD Rise UI

Beide neuronalen Netze zeigten in diesem Fall eine bewundernswerte Leistung Midjourney übertrifft die anderen leicht.

Eingabeaufforderung: Aufnahme von Slim Aarons von Wonder Woman im Raum, komplexe Ebenen und Texturen, detailliertes Charakterdesign, Hintergrund mit hellen, skurrilen und farbenfrohen Szenen, Pastellfarbkorrektur wie bei Wes Anderson-Filmen, Filmkörnung und Tokina AT-X 11–16 mm f /2.8 pro dx ii

Dall-E 3 schnitt hier deutlich schlechter ab; es hat die leuchtenden Farben der Stile, aber nicht die Klarheit der Details; Im Hintergrund tauchten deformierte Körper auf, und die Gesichter waren überhaupt nicht gelungen.

Eingabeaufforderung: Bild eines süßen, pummeligen Cybercot in seinem Online-Haus
Eingabeaufforderung: professionelle kommerzielle Studiofotografie für Nike; Modell mit langen Haaren; Ganzkörperaufnahme; trägt ein beiges Nike-T-Shirt; ungewöhnliche Nike-Jeansjacke; weiche beige Plüsch-Nike-Tasche; weiche lila Nike-Sneaker; stehend auf hellrosa-blauem Hintergrund; futuristischer Hintergrund einer komplexen, stromlinienförmigen Form mit Hintergrundbeleuchtung; Aufnahme mit Hasselblad X1D;

Es stellte sich heraus, dass es an beiden Orten interessant war, aber Dall-E 3 hatte erneut Probleme mit den Gesichtern. Stattdessen wurde eine beige Plüschtasche hergestellt, wie in der Aufforderung beschrieben, und Midjourney habe es außer Acht gelassen. In diesem Fall war Dall-E 3 bei der Ausführung der Aufforderung sehr gehorsam.

Eingabeaufforderung: Raytracing-Blasenfigur in Pastellfarben, weibliche Skulptur mit metallischem Finish, glänzend/glänzend, lebendige Turbulenzen, Pigeoncore, unkonventionelle Posen, anamorphotische Kunst, Schillern/Opalisieren, Video-Feedbackschleifen, glänzende Augen, kräftige Kurven, glänzender, fließender Figuratismus
prompt: eine Vintage-Retro-Collage von Superhelden, darunter Wonder Woman, Captain America, Batman und The Joker

Auch wenn sich beide Raster hervorragend für Collagen eignen, bleibt Dall-E 3 der Aufforderung treuer; Es wurden nur die von uns angegebenen Helden hinzugefügt, es konnte nicht in einen Joker umgewandelt werden und es kreuzte den Kapitän mit Batman.

Eingabeaufforderung: metallischer Raytracing-Klecks, anamorphotische Kunst, auffällige Details, präzise Linien, kräftige Kurven, glänzend, fließender Figuratismus, Pastellfarben, dunkler Hintergrund
Eingabeaufforderung: Einfache Ebenen und Texturen, kompliziertes Charakterdesign, lebendige, skurrile und farbenfrohe Hintergründe, Pastellfarbkorrektur à la Wes Anderson-Filme, Filmkörnung und ein Tokina at-x 11-16mm f/2.8 pro dx ii Objektiv sind alle vorhanden in diesem von Slim Aarons aufgenommenen Bild von Spider-Man, der sich auf einem Sofa entspannt.

Midjourney war in der Lage, die jeweiligen Stile der beiden Künstler von Anfang an zu kombinieren, während Dall-E 3 dem Hintergrund nur viele geschäftige Details und leuchtende Farben hinzufügte.

Eingabeaufforderung: Ein Foto aus den 80er Jahren mit pummeligen, süßen, fetten Katzen, die an einem Aerobic-Kurs teilnehmen und dabei amüsante Leggings mit Leopardenmuster und rosa Bodys tragen, wurde mit einer Kodak Gold 200 aufgenommen.

Die Katzen sind wieder einmal in Höchstform und beide neuronalen Netze verstehen Filmkameras perfekt. Allerdings fügt Dall-E 3 den Bildern sogar Körnung hinzu.

In den 1990er Jahren spielt Leonardo DiCaprio einen Jedi-Meister auf einer russischen Datscha, während er ein Lichtschwert schwingt und einen grünen Strickpullover trägt.

Dall-E 3 schuf einen jungen Leonardo DiCaprio mit coolen Pullover-Texturen, fügte Filmkörnung und Farbschema hinzu und spiegelte sehr cool das Gefühl einer russischen Datscha wider. Midjourney war ein guter Farbreflektor für den Film und DiCaprio verlieh ihr ein reiferes Aussehen.

Eingabeaufforderung: eine Collage aus star Wars Bilder im Vintage-Retro-Stil

Obwohl beide Neuronale Netze sind geschickt darin, Collagen zu erstellen, wenn man genau hinschaut, Midjourney verzerrt Gesichter und einige Objektformen, während Dall-E 3 bei der Darstellung der Charaktere selbst genauer ist – es stellte sich sogar heraus, dass es sich um Chewbacca handelte.

Aufforderung: ein Bild einer russischen Gorgo-Medusa, die Balenciaga-Hypebeast-Streetwear trägt und mit Schlangen als Haaren durch eine Straße in Manhattan schlendert

Wenn Sie die Fotos vergrößern, werden Sie feststellen, dass Dall-E 3 verschwommene Augen hat; Midjourney, hingegen ist einwandfrei. Dall-E 3 verordnete auch eine Marke; die Schlangen auf den Köpfen wirken lebendiger und in Bewegung; Midjourney ließ sie immer liegen und nicht auf dem Kopf liegen.

Hinweis: Dieses preisgekrönte Foto von Slim Aarons zeigt einen als Fee verkleideten Spinnenmann, der ein rosa flauschiges Kleid trägt und einen Zauberstab in der Hand hält. Es wurde mit einer Fuji Superia X-TRA 800 Kamera aufgenommen.

Beide sind cool, aber Midjourney berücksichtigte sowohl den Stil des Künstlers als auch die Wirkung einer Filmkamera, während Dall-E 3 die Aufnahme in voller Länge ignorierte und nicht berücksichtigte.

Eingabeaufforderung: Fee der UdSSR mit Flügeln und Astronautenkostüm

Wir beschlossen auch, ein Foto mit Feen zu testen, aber Dall-E 3 weigerte sich hartnäckig, mitzumachen. Midjourney hat die Flügel nicht ignoriert, da der Verweis mit Flügeln hinzugefügt wurde. Als Dall-E 3 tatsächlich ein Foto machte, bot es einige interessante Möglichkeiten, allerdings mit einer Amerikanerin.

Eingabeaufforderung: eine Schnecke, die für ein Porträt posiert, während sie moderne Hipster-Kleidung, komplexe 4K-Ebenen und -Texturen, detailliertes Charakterdesign und Filmkörnung trägt. Der Hintergrund zeigt lebendige, skurrile und farbenfrohe Szenen.

Midjourney hat einen fantastischen Job gemacht, aber wir möchten besonders darauf aufmerksam machen, wie Dall-E 3 die Filmeffekte im Bild oben rechts erstellt und eine eigene weiße Handschrift hinzugefügt hat; es ist großartig geworden.

Eingabeaufforderung: Spider-Man, Batman und Iron Man trafen sich in einer Bar auf ein Bier.

Dall-E 3 konnte sehr gehorsam noch einmal alle Helden des Proms in einem Bild darstellen. Midjourney Ich habe mich sehr bemüht und war sogar kurz davor, erfolgreich zu sein.

Eingabeaufforderung: Sommersalat aus Tomaten und Gurken, Makro, vollständige Szene, warme Farben, hochwertiges fotorealistisches Hyperrealismus, natürliches Licht, Unreal Engine 5, Farbkorrektur, redaktionelle Fotografie, Fotografie, Fotoshooting, groß, episch, Artgerm, aufgenommen mit einem 70-mm-Objektiv, Schärfentiefe, DOF, Neigungsunschärfe, Verschlusszeit 1/1000, F/22, Weißabgleich, 32k, Superauflösung

Auf den ersten Blick scheinen beide gut zu sein, doch bei näherer Betrachtung zeigt sich, dass es dem Dall-E 3 an fotorealistischem Volumen mangelt Midjourney bearbeitete die Gelenke mit Gabeln mit einem Knall.

Aufforderung: ein McDonald's im Stil fantasievoller Weltraumlandschaften mit realistischen menschlichen Figuren, zwei Autos und einem Traktor, über dem ein Mond steht. Les Nasbis, Pierre Pellegrini, wissenschaftlich fundiert, bahnbrechend, kühne Sättigung, Firecore

Beide Generatoren beherrschen ihre jeweiligen Fachgebiete, wobei Dall-E 3 in Text und Text hervorragend ist Midjourney hervorragend im Fotorealismus.

Der Haartrockner BaByliss D570DE kommt in einem modernen Interieur mit Abendbeleuchtung, Industriedesign und Pastellfarben zum Einsatz, perfekt für ein Studioshooting.

Die Physik und Geometrie von Haartrocknern ist schwierig Midjourney. Man kann viel Zeit damit verbringen, sich mit Versuchen und Referenzen herumzuschlagen, und manchmal ähneln die Ergebnisse einem Fön, aber Dall-E 3 lieferte beim ersten Versuch ein akzeptables Ergebnis und schrieb sogar den Text.

Eingabeaufforderung: Foto der einäugigen Turanga Leela aus futurama

Das einzige Auge ist gut, aber das ist eine andere Geschichte. In Midjourney, wir haben eine negative Aufforderung geschrieben – kein Cartoon, keine Illustration, flach, zwei Augen. Dall-E 3 gehorchte sofort und machte ein Auge, ein Lächeln und einen Hut ab, aber es weigerte sich rundweg, dass irgendjemand ein Foto von ihr machte.

Schauspieler Brad Pitt ist in den 1990er-Jahren dabei zu sehen, wie er die Gemüsebeete einer russischen Datscha bewässert, während er ein gestreiftes Tanktop und eine Jogginghose von adidas trägt. Die Szene wurde mit Agfa Vista 400 aufgenommen.

Midjourney Da die Generation nicht wie Brad war, nutzten wir den Zusatzdienst Insight Gesichts-Swap um Brads Gesicht auf die Generation zu richten; dazu gab es hier einen Beitrag. Dall-E 3 weiß, wer Brad Pitt ist und kann ohne zusätzliche Software Sterne zeichnen.

Eingabeaufforderung: ein wunderschönes Mädchen, Einhörner, Apfeltechnologien und eine Vintage-Retro-Collage aus Galaxien

Beide Netze sind gut, aber Dall-E 3 kann dabei Einhornhörner erzeugen Midjourney normalerweise nicht möglich.

Aufforderung: Eis in der Hand, Nike-Sportbekleidung und ein atemberaubender Fantasy-Elf, der auf einem Straßenfoto neben einem Ork sitzt.

Dall-E 3 hat die Charaktere gut in die Tat umgesetzt; Wir können einen Ork und einen Elfen mit Elfenohren sehen. Es gibt auch eine Person, die einen Nike-Trainingsanzug trägt, aber ihre Augen sind verschmiert. Die spitzen Ohren der Elfen werden von ihnen meist ignoriert Midjourney, und Nike wird ebenfalls ignoriert.

Eingabeaufforderung: Zeichnung einer als Astronaut verkleideten Fee der UdSSR

Als das Nachwort „Illustration“ zunächst aus der Eingabeaufforderung weggelassen wurde, erstellte Dall-E 3 eines. Wir haben uns dann für einen Vergleich entschieden Midjourney's Illustration. Während Midjourney Während Dall-E 3 eher Illustrationen aus der Sowjetzeit ähnelte und die Feenflügel nicht enthielt, hat er beim Zeichnen von Hammer und Sichel fantastische Arbeit geleistet. Das Beispiel rechts zeigt, wie Dall-E 3 im Text erscheinen könnte.

Eingabeaufforderung: Eine Datscha auf Jupiter, in der Ferne sind die Orbitalringe des Planeten zu sehen, ein Außerirdischer kocht ein Barbecue, komplizierte Charakterdesigns, helle, verrückte und farbenfrohe Hintergründe, Pastellfarbkorrektur à la Wes Anderson-Filme, Filmkörnung und ein Tokina AT -X 11-16 mm f/2.8 Pro dX II Objektiv

Aber, Midjourney ging zum Fotorealismus; Auf den Bildern gibt es keine Hauptfigur, nur die Umgebung, aber trotzdem cool. Dall-E 3 wollte nicht noch einmal auf dem Foto sein.

Eingabeaufforderung: Filmkörnung, Hundefutter, kompliziertes Charakterdesign, Ebenen und Texturen, helle, verrückte und farbenfrohe Szenen im Hintergrund und Pastellfarbkorrektur wie in einem Wes Anderson-Film

Dall-E 3 vs. Midjourney: Vor-und Nachteile

Bei der Erkundung dieser Technologie durch Benutzer sind mehrere bemerkenswerte Stärken und Einschränkungen zutage getreten, die weitere Einblicke in ihre Funktionalität ermöglichen.

Vorteile:

  1. Pünktlicher Gehorsam: Eines der herausragenden Merkmale von Dall-E 3 ist seine bemerkenswerte Fähigkeit, Anweisungen genau zu befolgen. Benutzer haben berichtet, dass das KI-Modell effektiv auf eine Vielzahl von Eingaben reagiert, was es zu einem vielseitigen Werkzeug für verschiedene Aufgaben macht.
  2. Vielfältige Kreativität: Dall-E 3 bietet die Möglichkeit, mehrere Charaktere in einem einzigen Bild darzustellen, was sein Potenzial für das Geschichtenerzählen und kreative Projekte erweitert. Dieser vielschichtige Ansatz erhöht seinen Nutzen in verschiedenen Bereichen.
  3. Textintegration: Benutzer haben die Fähigkeit von Dall-E 3 bei der nahtlosen Integration von Text in Bilder hervorgehoben. Diese Funktion erleichtert die Erstellung visuell ansprechender Inhalte mit eingebetteten Textelementen.

Nachteile:

  1. Bildklarheit: Eine bemerkenswerte Einschränkung ist die Tendenz der KI, Bilder mit unscharfen Gesichtern und Augen zu erzeugen. Obwohl es sich durch Kreativität auszeichnet, mangelt es ihm manchmal an der Klarheit und Präzision, die man bei von Menschen erstellten Inhalten findet.
  2. Stilkonsistenz: Dall-E 3 reproduziert nicht konsequent die Stile bestimmter Künstler, was für diejenigen, die eine präzise künstlerische Nachahmung suchen, ein Nachteil sein kann.
  3. VPN-Anforderung: Der Zugriff auf Dall-E 3 erfordert derzeit die Verwendung eines VPN, was für einige Benutzer möglicherweise Probleme mit der Zugänglichkeit darstellt.
  4. Bildverwaltung: Bei der Verwaltung generierter Bilder auf der Microsoft Bing-Website sind Benutzer auf Einschränkungen gestoßen. Insbesondere gibt es keine Formatausrichtungsfunktion und der Bildverlauf ist auf die letzten Uploads beschränkt, sodass ein sofortiges Kopieren zur späteren Verwendung erforderlich ist.
  5. Generierungsgeschwindigkeit: In einigen Fällen wurde berichtet, dass der Generierungsprozess in Dall-E 3 im Vergleich zu anderen KI-Modellen langsamer ist.

Trotz dieser Einschränkungen ist Dall-E 3 vielversprechend. Benutzer und Experten erkennen gleichermaßen das Potenzial, die Erstellung von Inhalten und das Geschichtenerzählen zu revolutionieren. Als OpenAI Während Dall-E 3 sein Angebot weiter verfeinert und erweitert, wird erwartet, dass die Stärken des Dall-E XNUMX noch deutlicher zum Vorschein kommen und ihn zu einem wertvollen Werkzeug in verschiedenen Bereichen machen.

FAQs

Sowohl Dall-E 3 als auch Midjourney haben ihre Stärken und Schwächen. Dall-E 3 reagiert besonders gut auf Eingabeaufforderungen und kann Texte nahtlos in Bilder integrieren. Es entstehen jedoch manchmal Bilder mit verschwommenen Gesichtern und Augen und die Stile bestimmter Künstler werden möglicherweise nicht konsequent wiedergegeben. Andererseits, Midjourney zeichnet sich durch Fotorealismus aus, erfasst das Wesentliche bestimmter Aufforderungen jedoch möglicherweise nicht immer so genau wie Dall-E 3.

Der Artikel bietet Text-zu-Bild-Eingabeaufforderungen und präsentiert die Ergebnisse von Dall-E 3 und Midjourneyund erklärt die Unterschiede zwischen den beiden Kunstgeneratoren.

Beide KI-Modelle haben ihre Stärken und Schwächen. Zum Beispiel in einer Aufforderung über einen Raumfahrer auf dem Jupiter: Midjourney übertraf Dall-E 3 leicht. In einer anderen Ansage über Wonder Woman war Dall-E 3 jedoch genauer darin, das Wesentliche der Ansage einzufangen.

  • Pünktlicher Gehorsam: Dall-E 3 folgt den Anweisungen genau.
  • Vielfältige Kreativität: Es können mehrere Charaktere in einem einzigen Bild dargestellt werden.
  • Textintegration: Dall-E 3 kann Text nahtlos in Bilder integrieren.
  • Bildklarheit: Es entstehen manchmal Bilder mit verschwommenen Gesichtern und Augen.
  • Stilkonsistenz: Dall-E 3 reproduziert nicht konsequent die Stile bestimmter Künstler.
  • Bildverwaltung: Es gibt Einschränkungen bei der Verwaltung generierter Bilder auf der Microsoft Bing-Website.
  • Generationsgeschwindigkeit: Der Generierungsprozess von Dall-E 3 kann im Vergleich zu anderen KI-Modellen langsamer sein.

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Weitere Artikel
Damir Jalalow
Damir Jalalow

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Angesichts der Volatilität wächst der institutionelle Appetit auf Bitcoin-ETFs

Offenlegungen in 13F-Anmeldungen zeigen, dass namhafte institutionelle Anleger sich mit Bitcoin-ETFs beschäftigen, was die wachsende Akzeptanz von ... unterstreicht.

Weitere Informationen

Der Tag der Verurteilung steht vor der Tür: Das Schicksal von CZ bleibt ungewiss, während das US-Gericht den Plädoyer des DOJ prüft

Changpeng Zhao steht heute vor einer Verurteilung vor einem US-Gericht in Seattle.

Weitere Informationen
Treten Sie unserer innovativen Tech-Community bei
Weiterlesen
Lesen Sie weiter
Side Protocol startet Anreiz-Testnetz und führt Insider-Punktesystem ein, das es Benutzern ermöglicht, SIDE-Punkte zu sammeln
Märkte Nachrichtenbericht Technologie
Side Protocol startet Anreiz-Testnetz und führt Insider-Punktesystem ein, das es Benutzern ermöglicht, SIDE-Punkte zu sammeln
9. Mai 2024
Web3 und Krypto-Events im Mai 2024: Erkundung neuer Technologien und aufkommender Trends in Blockchain und DeFi
Digest Geschäft Märkte Technologie
Web3 und Krypto-Events im Mai 2024: Erkundung neuer Technologien und aufkommender Trends in Blockchain und DeFi
9. Mai 2024
Notcoin startet auf OKX Jumpstart und bietet 1.25 % des gesamten Token-Angebots für den Bergbau
Märkte Nachrichtenbericht Technologie
Notcoin startet auf OKX Jumpstart und bietet 1.25 % des gesamten Token-Angebots für den Bergbau
9. Mai 2024
Puffer Finance startet sein Mainnet und verbessert die Einbindung von Knotenbetreibern für die Netzwerkdezentralisierung
Nachrichtenbericht Technologie
Puffer Finance startet sein Mainnet und verbessert die Einbindung von Knotenbetreibern für die Netzwerkdezentralisierung
9. Mai 2024