דיווח חדשות טכנולוגיה
ספטמבר 21, 2023

שחרור DALL-E 3 מגביר OpenAIההשפעה של, עוזבים Midjourney ו Stable Diffusion מאחור

בקיצור

DALL-E 3 מוגדר להשתלב בצורה חלקה עם GPT-4, מותאם במיוחד עבור ChatGPT+ מנויים.

DALL-E 3 נמנע מליצור מחדש תמונות של אישי ציבור כאשר שמותיהם מוזכרים במפורש.

ציר הזמן לגישה ל-DALL-E 3 נקבע לאוקטובר.

OpenAI חשפה את היצירה האחרונה שלה: DALL-E3. שלא כמו קודמיו, DALL-E 3 מתמקד בחידוד הפרטים, בטיפול בבעיות כמו אותיות ופרטי גוף מורכבים, כמו אצבעות. התוצאה? מערך של תמונות אסתטיות ללא צורך בהנחיות מורכבות או דרכים לעקיפת הבעיה.

שחרור DALL-E 3 מגביר OpenAIההשפעה של, עוזבים Midjourney ו Stable Diffusion מאחור

חשוב לציין שגרסה זו אינה מגיעה עם קבוצה מקיפה של פרטי יישום, מאמרים או ממשקי API. במקום זאת, DALL-E 3 מוגדר להיות משולב בצורה חלקה עם GPT-4, מותאם במיוחד עבור ChatGPT+ מנויים.

ייתכן שפיתוח זה אינו שינוי סיסמי בנוף הבינה המלאכותית, אלא צעד קדימה בשיתוף פעולה בין מודלים. רבים צופים כי הבא Stable Diffusion מודל יציע תחכום ומשיכה אמנותית עוד יותר.

כדי לשים את זה בהקשר, OpenAIהמסע של יצירת תמונות בינה מלאכותית היה די נסיעה:

  • 2021: DALL-E 1, מודל של 12 מיליארד פרמטרים, הוצג עם מידע מוגבל.
  • 2021: GLIDE, מודל של 2 מיליארד פרמטרים, נחשף יחד עם קוד פתוח של 300 מיליון מודלים של פרמטרים.
  • 2022: DALL-E 2 הגיע, עם 2 מיליארד פרמטרים, מלווה בנייר unCLIP וב-API.
  • 2023: DALL-E 3 עשה את כניסתו, ולמרות שהפרטים עשויים להיות מעט סודיים, דבר אחד ברור - הוא ישתלב עם GPT-4 ל ChatGPT+ מנויים.

נכון לעכשיו, התמונות החזותיות של DALL-E 3 נותרו מעטות. אין בסיס קוד, פוסט בבלוג או השוואה מפורטת עם הטכנולוגיה המתקדמת (SOTA). OpenAI נראה שהם שומרים את הקלפים שלהם קרוב לחזה.

שחרור DALL-E 3 מגביר OpenAIההשפעה של, עוזבים Midjourney ו Stable Diffusion מאחור

הדגם נחשב לבעל הבנה עמוקה יותר של ניואנסים ופרטים בהשוואה לקודמיו. המשמעות היא שתרגום המושגים היצירתיים שלך לתמונות מדויקות ביותר צפוי להיות תהליך חלק יותר.

הבטחה מסקרנת אחת של DALL-E 3 היא השילוב שלו עם ChatGPT. זה מרמז שמשתמשים לא יצטרכו להתמודד עם יצירת הנחיות מורכבות; תיאור קצר צריך להספיק, עם ChatGPT יצירת הנחיות מפורטות בשמך.

OpenAI הדגיש גם את חשיבות ההקשר בהנחיות ארוכות. DALL-E 3 נועד לאמץ מילוליות, מה שהופך אותו למותאם יותר להקשר המתואר בהנחיות נרחבות.

עם זאת, כמו בכל דגם חדש של בינה מלאכותית, ישנו אלמנט של הלא נודע. בעוד שהצצות ראשוניות נראות מבטיחות, מבחן הלקמוס האמיתי יגיע עם שימוש ממושך. שאלות מתעכבות לגבי יעילותו ומהירות הפעולה שלו.

סביר להניח ש-DALL-E 3 יהיה תהליך דיפוזיה רב-שלבי, עם GPT-4 משמש כמקודד הטקסט. המכניקה המורכבת של התקנה זו עשויה להישאר אפופה בסודיות.

ציר הזמן לגישה ל-DALL-E 3 נקבע לאוקטובר, תחילה עבור ChatGPT בנוסף ו ChatGPT משתמש ארגוניs, עם אפשרות לגישה רחבה יותר לחוקרים לאחר מכן.

מוצרים מקושרים: OpenAIאלטמן של אלטמן בסנאט האמריקאי לדון בסיכונים של AI

ניואנסים ו צֶנזוּרָה של DALL-E 3

המוקדים העיקריים בפיתוח של DALL-E 3 היו התהליך הקפדני של ריסון היכולות שלו. זה כלל יישור קפדני ומסננים שנועדו לא לכלול סוגים ספציפיים של תוכן. לדוגמה, הדוגמנית מסרבת בתוקף ליצור תמונות של אישים מפורסמים, לשכפל יצירות אמנות בסגנון של אמנים בעלי שם, או ליצור כל תוכן שנחשב לא בטוח על ידי OpenAIהסטנדרטים המובחנים של. גישה אסטרטגית זו אינה עוסקת רק במגבלות; זהו צעד פרואקטיבי שמטרתו להגן על החברה מפני הסתבכויות משפטיות פוטנציאליות.

עם זאת, מעבר לפילטרים והיישורים הללו, מתגלות כמה תצפיות מסקרנות. נראה כי DALL-E 3 מפגין חולשה מסוימת בכל הנוגע ליצירת תוכן פוטוריאליסטי. במקום לייצר תמונות המחקות תצלומים אמיתיים ללא רבב, הפלט נושא איכות מסוגננת מובהקת. התמונות הללו המעוצבות בבינה מלאכותית משדרות מראה כמעט מעובד ומעט פלסטי. גם כאשר מתבקשים במפורש במילה "צילום", התוצאה נשארת מעוגנת בסגנונות האופייניים לה.

הנחיה מס' 1
הנחיה מס' 1: תצלום תקריב של סרטן נזיר השוכן בחול רטוב, עם קצף ים בקרבת מקום ופרטי המעטפת שלו ומרקם החול מודגשים.
הנחיה מס' 2
הנחיה מס' 2: ספה צהובה ותוססת בצורת בננה יושבת בסלון נעים, העקומה שלה מערסלת ערימה של כריות צבעוניות. על רצפת העץ, שטיח מעוצב מוסיף נופך של קסם אקלקטי, ועציץ יושב בפינה, מגיע לכיוון אור השמש המסנן מבעד לחלון.
הנחיה מס' 3
הנחיה מס' 3: תמונה של ספינה טרופה עתיקה השוכנת על קרקעית האוקיינוס. צמחים ימיים תבעו את מבנה העץ, ודגים שוחים פנימה ומחוצה מהחללים החלולים שלו. אוצרות שקועים ותותחים ישנים פזורים מסביב, ומספקים הצצה לעבר.

ראוי לציין שלמרות הייחודיות הללו, DALL-E 3 אכן מציע הצצה לפוטנציאל יוצא דופן. בין יצירותיו, כמה מקרים מפגינים דמיון בולט לצילומים. לזכור שהריאליזם המדומה של התמונות האלה לא בהכרח מתיישב עם האופן שבו יופיע תמונה אמיתית של אותו נושא, במיוחד אם הוא שקוע מתחת למים.

מוצרים מקושרים: מיקרוסופט חשפה את Designer, כלי הטקסט לתמונה המקצועי הראשון המבוסס על DALL-E 2

DALL-E 3 תכונות ופרטים

בואו ניקח רגע לסנן את הפיקסלים ולקרוא בין השורות כדי להבין מה הדגם החדש הזה באמת מציע.

אמנות הסטייליזציה: מציץ דרך OpenAIחשבון האינסטגרם של, תבחין בשפע של יצירות אמנות המאופיינת בסטייליזציה מעודנת. למרות שיש מגוון מרשים של קומפוזיציות ועיצובים מופשטים, נראה שהדגם מתרחק מהפקת תוכן פוטוריאליסטי. הדגש כאן הוא על אסתטיקה ויצירתיות, לא חיקוי המציאות.

אילוצים אמנותיים: DALL-E 3 לוקח נתיב שונה מקודמו. הוא מסרב בתוקף ליצור דימויים בסגנון של אמנים חיים, סטייה מוחלטת מ-DALL-E 2, שעלול לחקות סגנונות מסוימים של אמנים. זה עשוי להרים גבות בקהילה היצירתית, בדומה לקבלת הפנים הפושרת של Stable Diffusion 2.0.

אמנים מעצימים: בצעד לכבד את זכויות האמנים, OpenAI מאפשר לאמנים להחריג את עבודתם מגרסאות DALL-E עתידיות. על ידי שליחת תמונה שהם הבעלים של הזכויות עליה, אמנים יכולים לבקש הרחקה שלה מהפלט של הדגם. איטרציות עתידיות של DALL-E ימנעו מיצירת תוכן הדומה ל- סגנון האמן.

אבטחה וצנזורה: OpenAIהפרנויה של אבטחה מורגשת. הם שיתפו פעולה עם "צוותים אדומים" חיצוניים כדי לבדוק את אבטחת המודל והשתמשו במסווגי קלט כדי ללמד את המודל להתעלם ממילים ספציפיות שעלולות להוביל לתוכן מפורש או מזיק. DALL-E 3 נמנע מליצור מחדש תמונות של דמויות ציבוריות כאשר שמותיהם מוזכרים במפורש. האם ידוענים נופלים תחת הקטגוריה הזו עדיין לא ברור, מה שעלול להשפיע על איכות הפנים שנוצרו.

סימני מים ומעקב: יש רמז להטמעה של תגיות למעקב אחר "תמונות שנוצרו על ידי AI", המצביע על מהלך לכיוון טוב יותר של ניטור ותוכן שנוצר בסימון מים.

טקסט וידיים משופרים: OpenAI מציג שיפור יצירת טקסט ועיבוד ידני, טענה נפוצה בקרב המתחרים. המבחן האמיתי טמון בתפוקה בפועל מעבר לדוגמאות שנבחרו בדובדבן.

הבנה מרחבית: DALL-E 3 מצטיין בהבנת יחסים מרחביים המתוארים בהנחיות. זה משפר את יכולתו של המודל לבנות זוויות וקומפוזיציות מורכבות, אם כי המשתמשים ממתינים לראיות קונקרטיות יותר להבטחה זו.

כוחן של הנחיות: עיקרו של DALL-E3 טמון ביכולות המהירות שלו ובשילוב עם ChatGPT. הוא מבטיח אוטומציה, מהירות ופישוט של עיצוב מהיר. המגמה כאן היא לכיוון chatGPT יצירת הנחיות, מתרגמים רעיונות מעורפלים או הנחיות ראשוניות לרהוטות. ההבנה ההקשרית המשופרת של DALL-E 3 מייעלת את התהליך, ומאפשרת למשתמשים להתמקד בכוונה על פני מילולית.

טריטוריות לא ידועות: במיוחד נעדרים מהדיון היבטים כמו ציור, ציור חוץ, מילוי יצירתי ומודלים תלת מימדיים. היעדר תכונות אלה עשוי להוות מגבלה, במיוחד עבור משתמשים הרגילים לדגמים מגוונים יותר.

פרטי גישה: DALL-E 3 מוגדר להיות זמין עבור ChatGPT לקוחות פלוס ו-Enterprise בתחילת אוקטובר. עם זאת, הפרטים לגבי הקצאת זיכויים עבור ChatGPT משתמשי פלוס והעלויות הנלוות עדיין לא ברורות. הגישה תינתן דרך ה-API וה- OpenAI פלטפורמת מעבדות "מאוחר יותר בסתיו".

יכולת אינטגרציה: DALL-E אמור להשתלב בצורה חלקה במוצרי שותפים ומוצרי Microsoft. צפו להיות עדים ליצירת מצגות, איורים, עיצובים, לוגואים, הכל בהקשר ומוגבר בסיוע של ChatGPT. האינטגרציה הזו אמורה להפוך למיינסטרים, ולהוות אתגר משמעותי למתחרים כמו גוגל עם בארד שלה ואידיאוגרמה.

ההתכנסות של LLM ותוכן חזותי: ההיבט המסקרן ביותר טמון בהתכנסות של מודלים של שפה גדולה (LLMs) ומודלים ליצירת תוכן חזותי. זה מסמל מעבר מהנדסה מהירה מורכבת להבעת רעיונות בשפה נגישה יותר. ה-AI תאסוף הקשר ורעיונות מהביטויים הללו, ויציע אפשרויות יצירתיות שקשה לעמוד בפניהן.

מוצרים מקושרים: 50 הנחיות הטקסט לתמונה המובילות עבור מחוללי אמנות בינה מלאכותית Midjourney ו-DALL-E

DALL-E 3: היה מנהיג חדש בדור התמונות של AI

OpenAIההחלטה של ​​לשלב את DALL-E 3 ב- ChatGPT מערכת אקולוגית היא מהלך אסטרטגי. שילוב זה מעניק ל-DALL-E 3 גישה למסד נתונים עצום של משתמשים של 100 מיליון משתמשים פעילים. צעד זה משפר באופן משמעותי את הנגישות של DALL-E 3 ויש לו פוטנציאל לזנק את הפופולריות שלו.

נכון לעכשיו, Midjourney ו Stable Diffusion להתפאר מסביב 15 מיליון משתמשים רשומים. עם זאת, עם השילוב הזה, DALL-E 3 מוגדר לקבל גישה לבסיס משתמשים גדול פי עשרה - 100 מיליון משתמשים. זה הופך את ChatGPT מנוי פלוס תוכנית מושכת עוד יותר, מכיוון שהיא מציעה גישה לצ'אטבוט, לכלים אנליטיים ויצירת תמונות, והכל במחיר סביר.

האינטגרציה לא רק מועילה למשתמשים קיימים אלא גם משמשת כמגנט רב עוצמה למשתמשים חדשים. זה מרחיב את OpenAI טווח ההגעה והפופולריות של המערכת האקולוגית, מושך אנשים המחפשים פתרונות תוכן שנוצרו בינה מלאכותית.

המהלך האסטרטגי הזה אמור להגביר OpenAIההכנסות של ומדדי מפתח אחרים. סביר להניח שמשקיעי החברה יראו התפתחות זו בעין יפה, במיוחד לאור התקדמות האחרונה ירידה של 20% בנפח התנועה במשך הקיץ.

ChatGPT תנועת האינטרנט יורדת ב-20% בספטמבר וממשיכה לצנוח

קרא עוד נושאים קשורים:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
L3 Blockchain Degen Chain משתפת פעולה עם פלטפורמת תשתית כדי לטפל בבעיית ההשבתה שלה
דיווח חדשות טכנולוגיה
L3 Blockchain Degen Chain משתפת פעולה עם פלטפורמת תשתית כדי לטפל בבעיית ההשבתה שלה
מאי 13, 2024
3,050 ETH נכבסו היום מארנק ריבוי חתימות זוגיות עם 83,017 ETH נותרו תחת שליטת האקרים, מזהה התראות Cyvers
שוקי דיווח חדשות טכנולוגיה
3,050 ETH נכבסו היום מארנק ריבוי חתימות זוגיות עם 83,017 ETH נותרו תחת שליטת האקרים, מזהה התראות Cyvers
מאי 13, 2024
אלגוריתם הכרייה המופעל על ידי ZKPs Soland מכריזה על השקה ומכירה מוקדמת של כורה ל-20 יום
דיווח חדשות טכנולוגיה
אלגוריתם הכרייה המופעל על ידי ZKPs Soland מכריזה על השקה ומכירה מוקדמת של כורה ל-20 יום
מאי 13, 2024
כנען משיק את Avalon Bitcoin Miner A1566 החדש עם יעילות ביצועים מובילה
כנען משיק את Avalon Bitcoin Miner A1566 החדש עם יעילות ביצועים מובילה
מאי 13, 2024
CRYPTOMERIA LABS PTE. בע"מ.