AI Wiki אמנות טכנולוגיה
אוקטובר 02, 2023

Dall-E 3 לעומת Midjourney: השוואה גדולה בין מחוללי האמנות הבינה המלאכותית המתקדמת ביותר

הצטרפו אלינו למסע המרגש הזה כשאנו חוקרים את Dall-E 3 ו Midjourneyהדקויות, המורכבות והפוטנציאל הבלתי מנוצל של. מאמר זה מדגיש את ההשוואות המסקרנות ביותר המבוססות על מחקר שנעשה על ידי חובבת הבינה המלאכותית Atachkina; אם אתה מעוניין ללמוד עוד, לחץ על קישור.

Dall-E 3 לעומת Midjourney: השוואה גדולה בין מחוללי האמנות הבינה המלאכותית המתקדמת ביותר
Pro עצות
1. גלה את 50 הנחיות הטקסט לתמונה המובילות עבור מחוללי אמנות בינה מלאכותית Midjourney ו-DALL-E.
2. הצית את היצירתיות שלך עם 20 מחוללי האמנות המובילים בינה מלאכותית של טקסט לתמונה של 2023.

מאמר זה מספק הנחיה מטקסט לתמונה, תמונה המציגה את התוצאות מ-Dall-E 3 ו Midjourney, והסבר על ההבדלים בין השניים מחוללי אמנות. בואו נתחיל.

הנחיה: איש חלל עומד על צדק ומתבונן בזריחה. ממשק עתידני, פרספקטיבה בגוף ראשון, מפקד חלל, מד גשם וממשק HUD Rise

שתי הרשתות העצביות פעלו בצורה יוצאת דופן במקרה זה, עם ה Midjourney עולה במעט על האחרים.

הנחיה: צולם על ידי Slim Aarons מ-Wonder Woman בחדר, שכבות ומרקמים מורכבים, עיצוב דמויות מפורט, רקע עם סצנות בהירות, גחמניות וצבעוניות, תיקון צבעי פסטל כמו סרטי ווס אנדרסון, סרט גרעיני ו-Tokina AT-X 11-16mm f /2.8 pro dx ii

Dall-E 3 עשה כאן עבודה הרבה יותר גרועה; הוא קיבל את הצבעים הבהירים של הסגנונות, אבל לא את בהירות הפרטים; גופות מעוותות הופיעו ברקע, והפנים לא היו מוצלחות כלל.

הנחיה: תמונה של קוברקוט חמוד ושמנמן במעונו המקוון
הנחיה: צילום סטודיו מסחרי מקצועי עבור נייקי; דוגמנית עם שיער ארוך; זריקת גוף מלאה; לובש חולצת טריקו של נייקי בז'; ז'קט ג'ינס יוצא דופן של נייקי; תיק נייק קטיפה בז' רך; נעלי ספורט נייק סגולות רכות; עומד על רקע ורוד-כחול בהיר; רקע עתידני של צורה מסודרת מורכבת עם תאורה אחורית; צולם על Hasselblad X1D;

זה התברר כמעניין בשני המקומות, אבל Dall-E 3 שוב נאבק עם הפנים. במקום זאת, הוא יצר תיק בצבע בז' קטיפה לפי ההוראות בהנחיה, ו Midjourney התעלמו מזה. במקרה זה, Dall-E 3 היה צייתן מאוד בביצוע ההנחיה.

הנחיה: דמות בועות עם עקבות קרניים בצבעי פסטל, פיסול נשי עם גימורים מתכתיים, מבריק/מבריק, מערבולות תוססת, יונים, תנוחות לא שגרתיות, אמנות אנמורפית, ססגוניות/אופלסנטיות, לולאות משוב וידאו, עיניים נוצצות, קימורים עזים, פיגוריות מבריקה, זורמת
הנחיה: קולאז' רטרו וינטג' של גיבורי על, כולל וונדר וומן, קפטן אמריקה, באטמן והג'וקר

ופעם נוספת, בעוד ששתי הרשתות מייצרות קולאז'ים מצוינים, Dall-E 3 נאמן יותר להנחיה; זה הוסיף רק את הגיבורים שציינו, זה לא יכול להפוך לג'וקר, וזה חצה את הקפטן עם באטמן.

הנחיה: כתם מעקב אחר קרניים מתכתיות, אמנות אנמורפית, פרטים מושכים את העין, קווים מדויקים, קימורים נועזים, פיגורטיזם מבריק, קולח, צבעי פסטל, רקע כהה
הנחיה: שכבות ומרקמים פשוטים, עיצוב דמויות מורכב, רקעים חיים, גחמניים וצבעוניים, תיקון צבעי פסטל א-לה ווס אנדרסון, סרטי קולנוע ועדשת Tokina at-x 11-16mm f/2.8 pro dx ii נמצאים כולם בתמונה זו של ספיידרמן נרגע על ספה שצולמה על ידי סלים אהרון.

Midjourney הצליח לשלב את הסגנונות המתאימים של שני האמנים מההנחיה, בעוד ש-Dall-E 3 פשוט הוסיף הרבה פרטים עמוסים וצבעים בהירים לרקע.

הנחיה: תצלום משנות ה-80 של חתולים שמנמנים וחמודים המשתתפים בשיעור אירובי כשהם לובשים חותלות מנומרות משעשעות ובגדי גוף ורודים צולם ב-Kodak Gold 200.

שוב, החתולים נמצאים בכושר מעולה, ושתי הרשתות העצביות מבינות את מצלמות הסרט בצורה מושלמת. עם זאת, Dall-E 3 אפילו מוסיף גרעין לתמונות.

שנות ה-1990, ליאונרדו דיקפריו מגלם אמן ג'דיי על דאצ'ה רוסי כשהוא מניף חרב אור ולובש סוודר ירוק סרוג.

Dall-E 3 יצר ליאונרדו דיקפריו צעיר עם טקסטורות מגשרים מגניבות, הוסיף גרגירי סרט וערכת צבעים ושיקף בצורה מגניבה מאוד את התחושה של דאצ'ה רוסי. Midjourney היה משקף צבע טוב לסרט, ודיקפריו נתן לה מראה בוגר יותר.

הנחיה: קולאז' של מלחמת הכוכבים תמונות בסגנון רטרו וינטג'

למרות ששניהם רשתות עצביות מיומנים ביצירת קולאז'ים, אם מסתכלים היטב, Midjourney מעוות פרצופים וכמה צורות אובייקט, בעוד ש-Dall-E 3 מדויק יותר בביצוע הדמויות עצמן - זה אפילו התברר כ-Chewbacca.

הנחיה: תמונה של מדוזה גורגון רוסית לובשת בגדי רחוב של Balenciaga hypebeast ומטיילת ברחוב במנהטן עם נחשים לשיער

כאשר תקרב לתמונות, תבחין שלDall-E 3 יש עיניים מטושטשות; Midjourney, מצד שני, הוא ללא רבב. Dall-E 3 גם רשם מותג; הנחשים על הראשים נראים יותר חיים ובתנועה; Midjourney תמיד גרם להם לשכב, ולא על הראש.

הנחיה: התצלום עטור הפרסים הזה של סלים אהרון מציג איש עכביש מחופש לפיה לבוש בשמלה ורודה ורודה ומחזיק שרביט קסמים. הוא צולם עם מצלמת Fuji Superia X-TRA 800.

שניהם מגניבים, אבל Midjourney התייחס לסגנון של האמן כמו גם לאפקט של מצלמת סרט, בעוד ש-Dall-E 3 התעלם מהצילום באורך מלא ולא שקל אותו.

הנחיה: פיה של ברית המועצות עם כנפיים ותחפושת אסטרונאוט

קיבלנו גם את ההחלטה לבדוק תמונה עם פיות, אבל Dall-E 3 סירב בעקשנות לשתף פעולה. Midjourney לא התעלם מהכנפיים כי נוספה הפניה עם כנפיים. כאשר Dall-E 3 אכן צילם, הוא הציע כמה אפשרויות מסקרנות, אבל עם אישה אמריקאית.

הנחיה: חילזון מצטלם לפורטרט כשהוא לובש לבוש היפסטרי עכשווי, שכבות ומרקמים מורכבים של 4K, עיצוב דמויות מפורט וגרגירי סרט. הרקע כולל סצנות תוססות, גחמניות וצבעוניות.

Midjourney עשה עבודה נפלאה, אבל אנחנו רוצים למשוך תשומת לב מיוחדת לאופן שבו Dall-E 3 יצר את אפקטי הסרט בתמונה השמאלית העליונה והוסיף כתב יד לבן משלו; יצא נהדר.

הנחיה: ספיידרמן, באטמן ואיירון מן נפגשו לבירה בבר.

Dall-E 3 הצליח לממש בצייתנות רבה את כל גיבורי ההנחיה בתמונה אחת פעם נוספת. Midjourney השתדל מאוד ואף התקרב להצליח.

בקשה: סלט קיץ של עגבניות ומלפפונים, מאקרו, סצנה מלאה, צבעים חמים, היפר-ריאליסטי פוטו-ריאליסטי באיכות גבוהה, תאורה טבעית, 5 מנוע Unreal, דירוג צבע, צילום עריכה, צילום, צילום, גבוה, אפי, artgerm, צולם עם עדשת 70 מ"מ, עומק שדה, DOF, טשטוש הטיה, מהירות תריס 1/1000, F/22, איזון לבן, 32k, רזולוציית על

במבט ראשון, נראה ששניהם טובים, אך בדיקה מעמיקה יותר מגלה כי ל-Dall-E 3 חסר נפח פוטוריאליסטי וכי Midjourney טיפל במפרקים במזלגות בחבטה.

הנחיה: מקדונלדס בסגנון נופי חלל דמיוניים עם דמויות אנושיות ריאליסטיות, שתי מכוניות וטרקטור, עם ירח מעליו. Les Nasbis, פייר פלגריני, מבוסס מדע, רוויה נועזת חלוצית, Firecore

שני המחוללים בקיאים בתחומם, כאשר Dall-E 3 מצטיין בטקסט וב Midjourney מצטיין בפוטוריאליזם.

מייבש השיער BaByliss D570DE משמש בחלל פנים מודרני עם תאורת ערב, עיצוב תעשייתי וצבעי פסטל, מושלם לצילומי סטודיו.

קשה עבור הפיזיקה והגיאומטריה של מייבשי שיער Midjourney. אתה יכול לבזבז זמן רב במאבקים בניסיונות והפניות, ומדי פעם התוצאות דומות למייבש שיער, אבל Dall-E 3 הניב תוצאה מקובלת בניסיון הראשון ואף כתב את הטקסט.

הנחיה: תמונה של Turanga Leela בעלת עין אחת מ-futurama

העין היחידה טובה, אבל זה כבר סיפור אחר. ב Midjourney, כתבנו הנחיה שלילית - ללא קריקטורה, איור, שטוח, שתי עיניים. Dall-E 3 צייתה מיד והעלתה עין אחת, חיוך וכובע, אבל היא סירבה בתוקף לתת לאף אחד לצלם אותה.

השחקן בראד פיט נראה בשנות ה-1990 משקה את ערוגות גן הירק על דאצ'ה רוסי כשהוא לובש גופיית פסים ומכנסי טרנינג מאדידס. הסצנה צולמה ב-Agfa Vista 400.

Midjourney גרם לדור שלא לחבב את בראד, אז השתמשנו בשירות הנוסף Insight החלפת פנים לשים את פניו של בראד על הדור; היה פוסט על זה כאן. Dall-E 3 יודע מיהו בראד פיט ויכול לצייר כוכבים ללא כל תוכנה נוספת.

הנחיה: ילדה יפה, חדי קרן, טכנולוגיות תפוח וקולאז' רטרו וינטג' של גלקסיות

שתי הרשתות טובות, אבל Dall-E 3 יכול ליצור קרני חד קרן בזמן Midjourney בדרך כלל לא יכול.

הנחיה: גלידה ביד, בגדי ספורט של נייקי ושדון פנטזיה מהמם שיושב ליד אורק בתמונת רחוב.

Dall-E 3 עשה עבודה טובה בהוצאת הדמויות לפעולה; אנחנו יכולים לראות אורק ושדון עם אוזני שדון. יש גם אדם שלובש אימונית של נייקי, אבל העיניים שלו כתומות. האוזניים המחודדות האלפים מתעלמות בעיקר על ידי Midjourney, וגם נייק מתעלמת.

הנחיה: ציור של פיה של ברית המועצות לבושה כאסטרונאוט

כאשר ה"איור" שלאחר הכתבה נותר מחוץ להנחיה, Dall-E 3 יצר אחד. אז החלטנו להשוות את זה Midjourneyהאיור של. בזמן Midjourney דומה יותר לאיורים מתקופת ברית המועצות ולא כלל את כנפי הפיות, Dall-E 3 עשה עבודה נפלאה בציור הפטיש והמגל. הדוגמה מימין מראה כיצד Dall-E 3 עשוי להופיע בטקסט.

הנחיה: דאצ'ה על צדק, ניתן לראות את הטבעות המסלוליות של כוכב הלכת מרחוק, חייזר מבשל ברביקיו, עיצובי דמויות מורכבים, רקעים בהירים, מטורפים וצבעוניים, תיקון צבעי פסטל א-לה-ווס אנדרסון, סרטי קולנוע וטוקינה AT -X 11-16mm f/2.8 Pro dX II עדשת

עם זאת, Midjourney נכנס לפוטוריאליזם; אין דמות ראשית בתמונות, רק הסביבה, אבל עדיין מגניב. Dall-E 3 לא רצה להיות בתמונה שוב.

הנחיה: גרגירי סרט, מזון לכלבים, עיצוב דמויות מורכב, שכבות ומרקמים, סצנות בהירות, מטורפות וצבעוניות ברקע, ותיקון צבעי פסטל כמו בסרט של ווס אנדרסון

Dall-E 3 לעומת Midjourney: יתרונות וחסרונות

בזמן שמשתמשים חוקרים את הטכנולוגיה הזו, התגלו כמה חוזקות ומגבלות בולטים, ושופכים תובנות נוספות לגבי הפונקציונליות שלה.

יתרונות:

  1. צייתנות מהירה: אחת התכונות הבולטות של Dall-E 3 היא היכולת המדהימה שלו לעקוב אחר הנחיות במדויק. משתמשים דיווחו שמודל הבינה המלאכותית מגיב ביעילות למגוון רחב של קלט, מה שהופך אותו לכלי רב-תכליתי למשימות שונות.
  2. יצירתיות רבת פנים: Dall-E 3 מציג את היכולת לתאר דמויות מרובות בתוך תמונה אחת, ומרחיב את הפוטנציאל שלו לסיפור סיפורים ולפרויקטים יצירתיים. גישה רב-גונית זו משפרת את השימושיות שלה בתחומים שונים.
  3. שילוב טקסט: משתמשים ציינו את המיומנות של Dall-E 3 בשילוב טקסט בצורה חלקה בתמונות. תכונה זו מקלה על יצירת תוכן מרתק ויזואלית עם אלמנטים טקסטואליים מוטבעים.

חסרונות:

  1. בהירות תמונה: מגבלה בולטת היא הנטייה של ה-AI לייצר תמונות עם פנים ועיניים מטושטשות. הוא אמנם מצטיין ביצירתיות, אבל לפעמים אין בו את הבהירות והדיוק הנראים בתוכן שנוצר על ידי אדם.
  2. עקביות בסגנון: Dall-E 3 אינו משכפל באופן עקבי סגנונות ספציפיים של אמנים, מה שעשוי להוות חיסרון למי שמחפש חיקוי אמנותי מדויק.
  3. דרישת VPN: גישה ל-Dall-E 3 מחייבת כיום שימוש ב-VPN, מה שעשוי להציב אתגרי נגישות עבור חלק מהמשתמשים.
  4. ניהול תמונות: משתמשים נתקלו במגבלות בעת ניהול תמונות שנוצרו באתר Microsoft Bing. יש לציין כי אין פונקציית כיוון פורמט, והיסטוריית התמונות מוגבלת להעלאות אחרונות, מה שמחייב העתקה מיידית לשימוש מאוחר יותר.
  5. מהירות דור: במקרים מסוימים, תהליך היצירה ב-Dall-E 3 דווח כאיטי יותר בהשוואה לדגמי AI אחרים.

למרות מגבלות אלו, ל-Dall-E 3 הבטחה משמעותית. משתמשים ומומחים כאחד מכירים בפוטנציאל שלו לחולל מהפכה ביצירת תוכן ובסיפור סיפורים. כפי ש OpenAI ממשיך לשכלל ולהרחיב את ההיצע שלו, צפוי כי החוזקות של Dall-E 3 יזרחו עוד יותר, מה שיהפוך אותו לכלי בעל ערך בתחומים שונים.

שאלות נפוצות

גם Dall-E 3 וגם Midjourney יש את החוזקות והחולשות שלהם. Dall-E 3 מצייתת במיוחד להנחיות ויכולה לשלב טקסט בצורה חלקה בתמונות. עם זאת, לפעמים הוא מייצר תמונות עם פנים ועיניים מטושטשות וייתכן שלא ישכפל באופן עקבי סגנונות ספציפיים של אמנים. מצד שני, Midjourney מצטיין בפוטוריאליזם אבל אולי לא תמיד לוכד את המהות של הנחיות מסוימות בצורה מדויקת כמו Dall-E 3.

המאמר מספק הנחיות מטקסט לתמונה, המציג את התוצאות הן מ-Dall-E 3 והן Midjourney, ומסביר את ההבדלים בין שני מחוללי האמנות.

לשני דגמי הבינה המלאכותית יש את החוזקות והחולשות שלהם. למשל, בהנחיה על איש חלל על צדק, Midjourney עלה מעט על Dall-E 3. עם זאת, בהנחיה אחרת על Wonder Woman, Dall-E 3 היה מדויק יותר בלכידת מהות ההנחיה.

  • צייתנות מהירה: Dall-E 3 עוקב בדיוק אחר ההנחיות.
  • יצירתיות רבת פנים: זה יכול לתאר מספר דמויות בתמונה אחת.
  • שילוב טקסט: Dall-E 3 יכול לשלב בצורה חלקה טקסט בתמונות.
  • בהירות תמונה: לפעמים זה מייצר תמונות עם פנים ועיניים מטושטשות.
  • עקביות בסגנון: Dall-E 3 אינו משכפל באופן עקבי סגנונות ספציפיים של אמנים.
  • ניהול תמונות: ישנן מגבלות בעת ניהול תמונות שנוצרו באתר Microsoft Bing.
  • מהירות דור: תהליך היצירה של Dall-E 3 יכול להיות איטי יותר בהשוואה לדגמי AI אחרים.

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories

Lisk עובר רשמית ל-Ethereum Layer 2 וחושפת Core v4.0.6

by אליסה דוידסון
מאי 08, 2024
הצטרף לניוזלטר שלנו.
חדשות אחרונות

Lisk עובר רשמית ל-Ethereum Layer 2 וחושפת Core v4.0.6

by אליסה דוידסון
מאי 08, 2024

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
Lisk עובר רשמית ל-Ethereum Layer 2 וחושפת Core v4.0.6
דיווח חדשות טכנולוגיה
Lisk עובר רשמית ל-Ethereum Layer 2 וחושפת Core v4.0.6
מאי 8, 2024
מטבעות Meme חדשים של מאי 2024: 7 בחירות לאוהדי קריפטו
תקציר שוקי טכנולוגיה
מטבעות Meme חדשים של מאי 2024: 7 בחירות לאוהדי קריפטו
מאי 8, 2024
פעולות כריית הקריפטו המאסיביות של איראן מהוות איום ישיר על הביטחון הלאומי של ארה"ב, סנאטורים דוחקים בפעולה מיידית של הממשלה
שוקי סיפורים וסקירות טכנולוגיה
פעולות כריית הקריפטו המאסיביות של איראן מהוות איום ישיר על הביטחון הלאומי של ארה"ב, סנאטורים דוחקים בפעולה מיידית של הממשלה
מאי 8, 2024
Synternet משלב את Peaq בשכבת הנתונים שלו כדי להפעיל DApps מונעי אירועים עם נתוני DePIN בזמן אמת
עסקים דיווח חדשות טכנולוגיה
Synternet משלב את Peaq בשכבת הנתונים שלו כדי להפעיל DApps מונעי אירועים עם נתוני DePIN בזמן אמת
מאי 8, 2024
CRYPTOMERIA LABS PTE. בע"מ.