ראיון אישי אמנות SMW
מאי 01, 2023

DeepFloyd ומעבר לכך: חקר את החידושים האחרונים באמנות בינה מלאכותית עם מנכ"ל NightCafe Studio

בקיצור

במהלך ראיון בלעדי, המנכ"ל של NightCafe Studio סיפק תובנות ונקודות מבט חשובות על אמנות שנוצרת בינה מלאכותית.

אנגוס ראסל הציג את DeepFloyd - אלגוריתם חדש שפותח על ידי השותף של NightCafe Studio, Stability AI, הפועל בחלל פיקסלים ומשתמש במודל שפה גדול (LLM) ליצירת תמונות.

סטודיו NightCafe הוא מחולל אמנות AI המאפשר למשתמשים ליצור אמנות מהממת ועתידנית תוך שניות בעזרת בינה מלאכותית. נוסדה על ידי אנגוס ראסל לפני ארבע שנים, NightCafe Studio נולד מהתסכול של אנגוס עצמו מכך שלא הצליח למצוא יצירות אמנות שהדהדו אותו. מונע מהידיעה שקיימים אלגוריתמים להעברת סגנון, הוא חיפש אתר שיאפשר לו ליצור אמנות מותאמת אישית באמצעות העברת סגנון ולהדפיס אותה. 

לאכזבתו, הוא לא מצא פלטפורמה כזו. אולם נסיגה זו הציתה אצלו רעיון חדשני. הוא החליט ליצור אפליקציה להעברת סגנון עצבי ליצירת אמנות שנוצרת בינה מלאכותית, והוא העלה אותה ב-Reddit.

NightCafe Studio נוצר כפלטפורמה ליצירת טקסט לתמונה, מה שהופך אותו לראשון מסוגו. תכונה ייחודית זו הביאה לעלייה משמעותית הן בהכנסות והן בבסיס המשתמשים. מאז, הפלטפורמה נותרה בחזית הבינה המלאכותית הגנרטיבית, ומושכת אליה קהילה גדולה של חובבים שמתענגים על השימוש בגנרטור ליצירת יצירות אמנות מדהימות. כיום, NightCafe Studio נחשב לאחד ממחוללי התמונות הפופולריים והחדשניים ביותר של AI.

במהלך ראיון עם אנגוס ראסל, חקרנו את היתרונות והמגבלות של אמנות שנוצרת בינה מלאכותית, את השימוש הגובר בבינה מלאכותית בעולם האמנות ואת האלגוריתם האחרון ליצירת תמונות בינה מלאכותית, DeepFloyd.

סטודיו לקפה לילה
בית האופרה של סידני: אחת התמונות הראשונות של אנגוס שנוצרו בבינה מלאכותית

הופעתה של אמנות שנוצרת בינה מלאכותית

בעשור האחרון, תעשיית האמנות הייתה עדה לחדירה הדרגתית של AI ולמידת מכונה (ML). טכנולוגיות מתקדמות אלה הציגו כמה מושגים חדשים מרתקים, כגון Deepfakes ו DALL-E, שזכו לתשומת לב משמעותית ברחבי העולם. כיום, תעשיית האמנות לא יכולה להרשות לעצמה להתעלם מההשפעה העצומה של הבינה המלאכותית, שמחוללת כעת מהפכה שהייתה מזמן במגזר.

אנגוס דנה כיצד NightCafe Studio חווה עליות בצמיחה במהלך השחרור של Stable Diffusion, דגם טקסט לתמונה שהחברה שלו עלתה איתו לאוויר ביום ההשקה. מאז, חסם הכניסה ליצירת כלים דומים ירד עקב מקורות פתוחים של אלגוריתמים וקודים לדוגמה.

מייסד NightCafe Studio מאמין שיצירת אמנות בינה מלאכותית היא לא רק על המוצר הסופי אלא גם על תהליך יצירתו. הוא רואה בזה סוג של טיפול והרפיה, המאפשר לאנשים לבטא את עצמם בדרכים ייחודיות ויצירתיות. אנשים רבים שמעולם לא ראו את עצמם יצירתיים גילו את היכולות האמנותיות שלהם באמצעות תמונות שנוצרו על ידי בינה מלאכותית. פילוסופיה זו באה לידי ביטוי בממשק המשתמש של הפלטפורמה, אשר נועד להיות ידידותי למשתמש ונגיש לאמנים בכל רמות המיומנות. 

ב-NightCafe Studio לבדו, יש כבר בין שניים לשלושה מיליון משתמשים בחודש, ומייצרים כמיליון תמונות ביום. Stability AI, חברת בינה מלאכותית מחוללת בקוד פתוח, אמור שהיו להם למעלה מ-10 מיליון משתמשים שהיו פעילים מדי יום זמן קצר לאחר ההשקה של Stable Diffusion.

מומלץ: 10+ מחוללי אמנות הבינה המלאכותית הטובים ביותר לשנת 2023: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: האלגוריתם החדש ליצירת תמונות AI שמשנה את המשחק

NightCafe Studio מיישם אלגוריתם חדש של Stability AI נקרא דיפפלויד, שמבטיח לחולל מהפכה באופן שבו אנו יוצרים תמונות עם בינה מלאכותית.

DeepFloyd, שנמצא כעת בגרסת בטא, הוא מודל טקסט לתמונה חדש שיכול ליצור תמונות מרשימות מתיאורי שפה טבעית. הוא מבוסס על ארכיטקטורה חדשנית המשלבת מודל שפה גדול עם שלושה מודלים של דיפוזיה. זה בהשראת Imagen, מודל דומה שפותח על ידי Google Research אך מעולם לא שוחרר לציבור.

המודל יכול ליצור תמונות ברורות וקוהרנטיות עם טקסט ואובייקטים ביחסים מרחביים שונים, וזו משימה מאתגרת עבור רוב המודלים האחרים של טקסט לתמונה. זה מושג באמצעות מודל השפה הגדול T5-XXL-1.1 כמקודד טקסט וכמות משמעותית של שכבות תשומת לב צולבת של טקסט-תמונה המספקות הנחיות וברית תמונה טובה יותר. 

DeepFloyd יכול גם ליצור תמונות עם יחס גובה-רוחב לא סטנדרטי ובעל רמה גבוהה של פוטוריאליזם. בנוסף, הוא מאפשר תרגומי תמונה לתמונה בצילום אפס, מה שאומר שניתן לשנות את הסגנון, התבניות והפרטים של תמונת פלט תוך שמירה על הצורה הבסיסית של תמונת המקור ללא צורך בכוונון עדין.

האלגוריתם החדש פועל בצורה שונה מזו Stable Diffusion. DeepFloyd משתמש בחלל פיקסלים ובמודל שפה גדול (LLM), ואילו Stable Diffusion משתמש במרחב סמוי ובמודל CLIP קבוע. DeepFloyd גם משתמש במספר תהליכי דיפוזיה כדי ליצור תמונות, תוך כדי Stable Diffusion משתמש רק באחד בודד.

DeepFloyd הוא שמה של קבוצת המחקר שבנתה את האלגוריתם, והאלגוריתם עצמו נקרא IF. קבוצת המחקר כוללת רבים מאותם אנשים שיצרו GPT-3קודמו של, GPT-2, ומודל שפה חדשני קודם בשם RuGPT.

כמה השערות מצביעות על כך שהשם IF עשוי להיות בהשראת שיר של פינק פלויד באותו שם, כפי שנרמז מהביוס של קבוצת מחקר האלגוריתמים של המדיה החברתית.

קרא עוד על האלגוריתם כאן.

סטודיו לקפה לילה deepfloyd
תמונות שנוצרו עם DeepFloyd IF. מָקוֹר: Stability AI

השוואת מגבלות אמנות בינה מלאכותית ואמנות דיגיטלית

אחת ממגבלות הבינה המלאכותית העיקריות היא טקסט, אם כי DeepFloyd מתמודד עם בעיה זו. מגבלה נוספת היא הקושי לקבל תמונה בדיוק כפי שנחזה, במיוחד ללא הנחיה של מומחים. AI גם חסרה את היכולת להבין ולפרש את הקשרים תרבותיים וחברתיים המעצבים את האמנות האנושית. לכן, אמנות שנוצרת בינה מלאכותית יכולה לפעמים לייצר יצירות שנראות לא במקום או חסרות רגישות תרבותית.

עם זאת, תמונות שנוצרו על ידי AI עדיין יכולות להיות יפות ולעיתים אפילו טובות מהרעיון המקורי, כל עוד המשתמש פתוח להיות מופתע, אמר אנגוס. חוץ מזה, יש דרכים לשנות את תמונות שנוצרו באמצעות אלגוריתמי AI או Photoshop. בעוד שקבלת תמונה מדויקת היא כיום תחום של מחקר פעיל, מתבצעת התקדמות משמעותית. ייתכן שבקרוב תהיה אפשרות לקבל שליטה מלאה על כל היבט של תמונה. 

בינה מלאכותית מסתמכת על התמונות והאמנות הקיימות ברשת כהשראה, אבל רק על אלה שהיא הוכשרה עליהן. אלגוריתמים שונים, כגון Midjourney, DALL-E ו Stable Diffusion, מאומנים על מערכי נתונים שונים, מה שאומר שהם עשויים לבצע ביצועים טובים יותר בסוגים ספציפיים של תמונות. 

לאחרונה, חוקרים חוקרים את ההשפעה של הסרת תמונות באיכות נמוכה ממערכות אימון כדי לשפר את תוצאות הבינה המלאכותית. על ידי סינון של תמונות באיכות נמוכה אלה, מערך הנתונים המתקבל עשוי להיות קטן יותר אך איכותי יותר, מה שיוביל לתוצאות טובות יותר מבלי להגדיל את הגודל של דגמי AI או לדרוש חומרה יקרה יותר. אנגוס שיתף שגישה זו מייצגת דרך מבטיחה לשפר את האיכות של תמונות שנוצרו בינה מלאכותית מבלי להסתמך על מודלים גדולים ועתירי משאבים יותר.

בעיה אחת עם בינה מלאכותית באמנות היא שהיא עלולה להמעיט בערכם של אמנים אנושיים, שמבזבזים זמן רב ביצירת אמנות, בעוד שבינה מלאכותית מסוגלת לייצר אמנות תוך שניות. עם זאת, ישנה איכות בלתי מוחשית מסוימת לאמנות האנושית שעלולה להיות קשה לשכפל של בינה מלאכותית, כגון העומק הרגשי והמורכבות הקיימים לעתים קרובות ביצירות שנוצרו על ידי אדם. NightCafe Studio מאמין ש-AI עוסק פחות ביצירת אמנות למטרות מסחריות ויותר בהנאה מתהליך היצירה עצמו.

"תמיד יהיה ערך באמנות מעשה ידי אדם מכיוון שהיא מייצגת את המאמץ והמיומנות של האמן, בעוד לאמנות שנוצרת בינה מלאכותית אין את אותו ערך מהותי."

אמר אנגוס.

סוגיה אתית סביב בינה מלאכותית באמנות היא השימוש בתדמית ציבורית לאימון אלגוריתמי בינה מלאכותית שאולי אינם שייכים לחברה המאמנת את הבינה המלאכותית. למרות שכרגע אין חוקים שנפרו, זה מעלה שאלות לגבי הסכמה ופרטיות. חברות קוד פתוח כמו OpenAI ו-DALL-E עובדים על הפיכת התהליך לאתי יותר, אך זו נותרה שאלה פתוחה. ייתכן שיהיו תקנות עתידיות לגבי השימוש בתמונות לאימון AI באמנות.

למרות החששות הללו, אנגוס מאמין שתהליך הבינה המלאכותית באמנות אינו שונה מהותית מאמנים אנושיים השואבים השראה מעבודותיהם של אמנים אחרים. בינה מלאכותית יודעת איך דברים נראים וזוכרת קטעים על תמונות, בדיוק כמו בני אדם. זה פשוט יותר טוב בליצור אותם מחדש מאפס.

קרא עוד:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

אגנה היא עיתונאית שמסקרת את המגמות וההתפתחויות האחרונות ב-metaverse, AI, ו Web3 תעשיות עבור Metaverse Post. התשוקה שלה לספר סיפורים הובילה אותה לערוך ראיונות רבים עם מומחים בתחומים אלה, כשהם מחפשים תמיד לחשוף סיפורים מרגשים ומרתקים. אגנה היא בעלת תואר ראשון בספרות ובעלת רקע נרחב בכתיבה על מגוון רחב של נושאים לרבות נסיעות, אמנות ותרבות. היא גם התנדבה כעורכת בארגון לזכויות בעלי חיים, שם סייעה להעלות את המודעות לנושאים של רווחת בעלי חיים. צור איתה קשר [מוגן בדוא"ל].

מאמרים נוספים
אגנה צימרמן
אגנה צימרמן

אגנה היא עיתונאית שמסקרת את המגמות וההתפתחויות האחרונות ב-metaverse, AI, ו Web3 תעשיות עבור Metaverse Post. התשוקה שלה לספר סיפורים הובילה אותה לערוך ראיונות רבים עם מומחים בתחומים אלה, כשהם מחפשים תמיד לחשוף סיפורים מרגשים ומרתקים. אגנה היא בעלת תואר ראשון בספרות ובעלת רקע נרחב בכתיבה על מגוון רחב של נושאים לרבות נסיעות, אמנות ותרבות. היא גם התנדבה כעורכת בארגון לזכויות בעלי חיים, שם סייעה להעלות את המודעות לנושאים של רווחת בעלי חיים. צור איתה קשר [מוגן בדוא"ל].

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
Injective מאחדת כוחות עם AltLayer כדי להביא אבטחה מחדש ל-inEVM
עסקים דיווח חדשות טכנולוגיה
Injective מאחדת כוחות עם AltLayer כדי להביא אבטחה מחדש ל-inEVM
מאי 3, 2024
מאסה משתפת פעולה עם Teller כדי להציג את מאגר ההלוואות של MASA, מאפשרת הלוואות ב-USDC על בסיס
שוקי דיווח חדשות טכנולוגיה
מאסה משתפת פעולה עם Teller כדי להציג את מאגר ההלוואות של MASA, מאפשרת הלוואות ב-USDC על בסיס
מאי 3, 2024
Velodrome משיקה את גרסת הבטא של Superchain בשבועות הקרובים ומתרחבת ברחבי OP Stack Layer 2 Blockchains
שוקי דיווח חדשות טכנולוגיה
Velodrome משיקה את גרסת הבטא של Superchain בשבועות הקרובים ומתרחבת ברחבי OP Stack Layer 2 Blockchains
מאי 3, 2024
CARV מכריזה על שותפות עם Aethir לביזור שכבת הנתונים שלה ולחלוקת תגמולים
עסקים דיווח חדשות טכנולוגיה
CARV מכריזה על שותפות עם Aethir לביזור שכבת הנתונים שלה ולחלוקת תגמולים
מאי 3, 2024
CRYPTOMERIA LABS PTE. בע"מ.