Dall-E 3 לעומת Midjourney: השוואה גדולה בין מחוללי האמנות הבינה המלאכותית המתקדמת ביותר
הצטרפו אלינו למסע המרגש הזה כשאנו חוקרים את Dall-E 3 ו Midjourneyהדקויות, המורכבות והפוטנציאל הבלתי מנוצל של. מאמר זה מדגיש את ההשוואות המסקרנות ביותר המבוססות על מחקר שנעשה על ידי חובבת הבינה המלאכותית Atachkina; אם אתה מעוניין ללמוד עוד, לחץ על קישור.
Pro עצות |
---|
1. גלה את 50 הנחיות הטקסט לתמונה המובילות עבור מחוללי אמנות בינה מלאכותית Midjourney ו-DALL-E. |
2. הצית את היצירתיות שלך עם 20 מחוללי האמנות המובילים בינה מלאכותית של טקסט לתמונה של 2023. |
מאמר זה מספק הנחיה מטקסט לתמונה, תמונה המציגה את התוצאות מ-Dall-E 3 ו Midjourney, והסבר על ההבדלים בין השניים מחוללי אמנות. בואו נתחיל.
שתי הרשתות העצביות פעלו בצורה יוצאת דופן במקרה זה, עם ה Midjourney עולה במעט על האחרים.
Dall-E 3 עשה כאן עבודה הרבה יותר גרועה; הוא קיבל את הצבעים הבהירים של הסגנונות, אבל לא את בהירות הפרטים; גופות מעוותות הופיעו ברקע, והפנים לא היו מוצלחות כלל.
זה התברר כמעניין בשני המקומות, אבל Dall-E 3 שוב נאבק עם הפנים. במקום זאת, הוא יצר תיק בצבע בז' קטיפה לפי ההוראות בהנחיה, ו Midjourney התעלמו מזה. במקרה זה, Dall-E 3 היה צייתן מאוד בביצוע ההנחיה.
ופעם נוספת, בעוד ששתי הרשתות מייצרות קולאז'ים מצוינים, Dall-E 3 נאמן יותר להנחיה; זה הוסיף רק את הגיבורים שציינו, זה לא יכול להפוך לג'וקר, וזה חצה את הקפטן עם באטמן.
Midjourney הצליח לשלב את הסגנונות המתאימים של שני האמנים מההנחיה, בעוד ש-Dall-E 3 פשוט הוסיף הרבה פרטים עמוסים וצבעים בהירים לרקע.
שוב, החתולים נמצאים בכושר מעולה, ושתי הרשתות העצביות מבינות את מצלמות הסרט בצורה מושלמת. עם זאת, Dall-E 3 אפילו מוסיף גרעין לתמונות.
Dall-E 3 יצר ליאונרדו דיקפריו צעיר עם טקסטורות מגשרים מגניבות, הוסיף גרגירי סרט וערכת צבעים ושיקף בצורה מגניבה מאוד את התחושה של דאצ'ה רוסי. Midjourney היה משקף צבע טוב לסרט, ודיקפריו נתן לה מראה בוגר יותר.
למרות ששניהם רשתות עצביות מיומנים ביצירת קולאז'ים, אם מסתכלים היטב, Midjourney מעוות פרצופים וכמה צורות אובייקט, בעוד ש-Dall-E 3 מדויק יותר בביצוע הדמויות עצמן - זה אפילו התברר כ-Chewbacca.
כאשר תקרב לתמונות, תבחין שלDall-E 3 יש עיניים מטושטשות; Midjourney, מצד שני, הוא ללא רבב. Dall-E 3 גם רשם מותג; הנחשים על הראשים נראים יותר חיים ובתנועה; Midjourney תמיד גרם להם לשכב, ולא על הראש.
שניהם מגניבים, אבל Midjourney התייחס לסגנון של האמן כמו גם לאפקט של מצלמת סרט, בעוד ש-Dall-E 3 התעלם מהצילום באורך מלא ולא שקל אותו.
קיבלנו גם את ההחלטה לבדוק תמונה עם פיות, אבל Dall-E 3 סירב בעקשנות לשתף פעולה. Midjourney לא התעלם מהכנפיים כי נוספה הפניה עם כנפיים. כאשר Dall-E 3 אכן צילם, הוא הציע כמה אפשרויות מסקרנות, אבל עם אישה אמריקאית.
Midjourney עשה עבודה נפלאה, אבל אנחנו רוצים למשוך תשומת לב מיוחדת לאופן שבו Dall-E 3 יצר את אפקטי הסרט בתמונה השמאלית העליונה והוסיף כתב יד לבן משלו; יצא נהדר.
Dall-E 3 הצליח לממש בצייתנות רבה את כל גיבורי ההנחיה בתמונה אחת פעם נוספת. Midjourney השתדל מאוד ואף התקרב להצליח.
במבט ראשון, נראה ששניהם טובים, אך בדיקה מעמיקה יותר מגלה כי ל-Dall-E 3 חסר נפח פוטוריאליסטי וכי Midjourney טיפל במפרקים במזלגות בחבטה.
שני המחוללים בקיאים בתחומם, כאשר Dall-E 3 מצטיין בטקסט וב Midjourney מצטיין בפוטוריאליזם.
קשה עבור הפיזיקה והגיאומטריה של מייבשי שיער Midjourney. אתה יכול לבזבז זמן רב במאבקים בניסיונות והפניות, ומדי פעם התוצאות דומות למייבש שיער, אבל Dall-E 3 הניב תוצאה מקובלת בניסיון הראשון ואף כתב את הטקסט.
העין היחידה טובה, אבל זה כבר סיפור אחר. ב Midjourney, כתבנו הנחיה שלילית - ללא קריקטורה, איור, שטוח, שתי עיניים. Dall-E 3 צייתה מיד והעלתה עין אחת, חיוך וכובע, אבל היא סירבה בתוקף לתת לאף אחד לצלם אותה.
Midjourney גרם לדור שלא לחבב את בראד, אז השתמשנו בשירות הנוסף Insight החלפת פנים לשים את פניו של בראד על הדור; היה פוסט על זה כאן. Dall-E 3 יודע מיהו בראד פיט ויכול לצייר כוכבים ללא כל תוכנה נוספת.
שתי הרשתות טובות, אבל Dall-E 3 יכול ליצור קרני חד קרן בזמן Midjourney בדרך כלל לא יכול.
Dall-E 3 עשה עבודה טובה בהוצאת הדמויות לפעולה; אנחנו יכולים לראות אורק ושדון עם אוזני שדון. יש גם אדם שלובש אימונית של נייקי, אבל העיניים שלו כתומות. האוזניים המחודדות האלפים מתעלמות בעיקר על ידי Midjourney, וגם נייק מתעלמת.
כאשר ה"איור" שלאחר הכתבה נותר מחוץ להנחיה, Dall-E 3 יצר אחד. אז החלטנו להשוות את זה Midjourneyהאיור של. בזמן Midjourney דומה יותר לאיורים מתקופת ברית המועצות ולא כלל את כנפי הפיות, Dall-E 3 עשה עבודה נפלאה בציור הפטיש והמגל. הדוגמה מימין מראה כיצד Dall-E 3 עשוי להופיע בטקסט.
עם זאת, Midjourney נכנס לפוטוריאליזם; אין דמות ראשית בתמונות, רק הסביבה, אבל עדיין מגניב. Dall-E 3 לא רצה להיות בתמונה שוב.
Dall-E 3 לעומת Midjourney: יתרונות וחסרונות
בזמן שמשתמשים חוקרים את הטכנולוגיה הזו, התגלו כמה חוזקות ומגבלות בולטים, ושופכים תובנות נוספות לגבי הפונקציונליות שלה.
יתרונות:
- צייתנות מהירה: אחת התכונות הבולטות של Dall-E 3 היא היכולת המדהימה שלו לעקוב אחר הנחיות במדויק. משתמשים דיווחו שמודל הבינה המלאכותית מגיב ביעילות למגוון רחב של קלט, מה שהופך אותו לכלי רב-תכליתי למשימות שונות.
- יצירתיות רבת פנים: Dall-E 3 מציג את היכולת לתאר דמויות מרובות בתוך תמונה אחת, ומרחיב את הפוטנציאל שלו לסיפור סיפורים ולפרויקטים יצירתיים. גישה רב-גונית זו משפרת את השימושיות שלה בתחומים שונים.
- שילוב טקסט: משתמשים ציינו את המיומנות של Dall-E 3 בשילוב טקסט בצורה חלקה בתמונות. תכונה זו מקלה על יצירת תוכן מרתק ויזואלית עם אלמנטים טקסטואליים מוטבעים.
חסרונות:
- בהירות תמונה: מגבלה בולטת היא הנטייה של ה-AI לייצר תמונות עם פנים ועיניים מטושטשות. הוא אמנם מצטיין ביצירתיות, אבל לפעמים אין בו את הבהירות והדיוק הנראים בתוכן שנוצר על ידי אדם.
- עקביות בסגנון: Dall-E 3 אינו משכפל באופן עקבי סגנונות ספציפיים של אמנים, מה שעשוי להוות חיסרון למי שמחפש חיקוי אמנותי מדויק.
- דרישת VPN: גישה ל-Dall-E 3 מחייבת כיום שימוש ב-VPN, מה שעשוי להציב אתגרי נגישות עבור חלק מהמשתמשים.
- ניהול תמונות: משתמשים נתקלו במגבלות בעת ניהול תמונות שנוצרו באתר Microsoft Bing. יש לציין כי אין פונקציית כיוון פורמט, והיסטוריית התמונות מוגבלת להעלאות אחרונות, מה שמחייב העתקה מיידית לשימוש מאוחר יותר.
- מהירות דור: במקרים מסוימים, תהליך היצירה ב-Dall-E 3 דווח כאיטי יותר בהשוואה לדגמי AI אחרים.
למרות מגבלות אלו, ל-Dall-E 3 הבטחה משמעותית. משתמשים ומומחים כאחד מכירים בפוטנציאל שלו לחולל מהפכה ביצירת תוכן ובסיפור סיפורים. כפי ש OpenAI ממשיך לשכלל ולהרחיב את ההיצע שלו, צפוי כי החוזקות של Dall-E 3 יזרחו עוד יותר, מה שיהפוך אותו לכלי בעל ערך בתחומים שונים.
שאלות נפוצות
גם Dall-E 3 וגם Midjourney יש את החוזקות והחולשות שלהם. Dall-E 3 מצייתת במיוחד להנחיות ויכולה לשלב טקסט בצורה חלקה בתמונות. עם זאת, לפעמים הוא מייצר תמונות עם פנים ועיניים מטושטשות וייתכן שלא ישכפל באופן עקבי סגנונות ספציפיים של אמנים. מצד שני, Midjourney מצטיין בפוטוריאליזם אבל אולי לא תמיד לוכד את המהות של הנחיות מסוימות בצורה מדויקת כמו Dall-E 3.
המאמר מספק הנחיות מטקסט לתמונה, המציג את התוצאות הן מ-Dall-E 3 והן Midjourney, ומסביר את ההבדלים בין שני מחוללי האמנות.
לשני דגמי הבינה המלאכותית יש את החוזקות והחולשות שלהם. למשל, בהנחיה על איש חלל על צדק, Midjourney עלה מעט על Dall-E 3. עם זאת, בהנחיה אחרת על Wonder Woman, Dall-E 3 היה מדויק יותר בלכידת מהות ההנחיה.
- צייתנות מהירה: Dall-E 3 עוקב בדיוק אחר ההנחיות.
- יצירתיות רבת פנים: זה יכול לתאר מספר דמויות בתמונה אחת.
- שילוב טקסט: Dall-E 3 יכול לשלב בצורה חלקה טקסט בתמונות.
- בהירות תמונה: לפעמים זה מייצר תמונות עם פנים ועיניים מטושטשות.
- עקביות בסגנון: Dall-E 3 אינו משכפל באופן עקבי סגנונות ספציפיים של אמנים.
- ניהול תמונות: ישנן מגבלות בעת ניהול תמונות שנוצרו באתר Microsoft Bing.
- מהירות דור: תהליך היצירה של Dall-E 3 יכול להיות איטי יותר בהשוואה לדגמי AI אחרים.
כתב ויתור
בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.
על המחבר
דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט.
מאמרים נוספיםדמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט.