Stability AI משחרר דגם חדש בשם SDXL Beta
בקיצור
Stability AI הוציאה דגם חדש בשם SDXL Beta (Stable Diffusion XL בטא). זהו דגם גדול יותר עם יותר פרמטרים וכמה שיפורים לא ידועים. זה זמין ב-DreamStudio, Stability AIמחולל התמונות הרשמי של, ומשתמש באלגוריתמים מתקדמים וטכניקות למידה עמוקה ליצירת ויזואליות מרהיבה.
Stability AI חשפה תצוגה מקדימה של דגם חדש בשם SDXL Beta, קיצור של Stable Diffusion XL בטא. עד כה, החברה לא שיתפה מידע רב על הדגם, אך הוא זמין לבדיקה עבור כל מי שרוצה לעשות זאת. בשביל מה חדש בדגם SDXL הזה stable diffusion? מה היתרונות והחסרונות שלו? בוא נחקור.
מהו בדיוק דגם ה-SDXL?
דגם SDXL הוא דגם חדש שנמצא כרגע מאומנים. הוא רחוק מלהסתיים, ועד שיצא, הרבה פרטים לגביו עשויים להשתנות; לכל מה שאנחנו יודעים, אולי אפילו לא קוראים לו דגם SDXL. כל מה שאנחנו יודעים זה שזה דגם גדול יותר עם יותר פרמטרים וכמה שיפורים לא ידועים. זה דגם v2, לא דגם v3 (מה שזה לא אומר). ייתכן שהשיפורים במודל v2 יכולים לשפר את ביצועי המערכת, אך ללא מידע נוסף, קשה לקבוע עד כמה שיפורים אלו עשויים להיות משמעותיים. בנוסף, זה יעזור לדעת אילו פרמטרים ספציפיים נוספו או הותאמו בגרסה זו.
דגם ה-SDXL זמין כעת ב-DreamStudio, Stability AIמחולל התמונות הרשמי של. בחר SDXL Beta מתפריט הדגם כדי לבדוק זאת. נראה שהוא משתמש באלגוריתמים מתקדמים ו טכניקות למידה עמוקה ליצירת ויז'ואל מרהיב המושלם עבור מגוון רחב של יישומים.
שיפורים
טקסט קריא. SDXL מסוגלת ליצור טקסט קריא וזו כנראה התכונה הבולטת ביותר שלה שכן זה לא היה אפשרי בדגמי v1 ו-v2.1 הקיימים. הטקסט שנוצר של SDXL לא תמיד מדויק כפי שניתן לראות ב- Stable Diffusion טקסט למטה. עם זאת, הוא עדיף בהרבה על v2.1, שלא לדבר על מודל v1. הסיבה לכך היא ש-SDXLs משתמש באלגוריתם למידה עמוקה מתקדם יותר המאפשר לה להבין וליצור מבני שפה מורכבים יותר. עם פיתוח נוסף, יש לו פוטנציאל להפוך אפילו יותר מדויק ואמין.
אנטומיה אנושית. הדור המדויק של דמויות אנושיות נכונות מבחינה אנטומית הוא כבר מזמן אתגר עבור stable diffusion. נוכחותם של איברים נוספים או חסרים היא שכיחה. בדרך כלל משתמשים בציור בציור כדי לתקן אותם, או, לאחרונה, אתה יכול להשתמש בתכונת Open Pose של ControlNet כדי לשכפל תנוחה מתמונת התייחסות. אנו שמחים לציין שכאן השתפר דגם הבטא של SDXL. מודל ה-SDXL Beta הראה שיפור משמעותי בשכפול מדויק של תנוחות מתמונות התייחסות. זה יכול להיות כלי רב ערך עבור יישומים שונים כגון אנימציה ומציאות מדומה.
סגנון דיוקן. SDXL Beta מייצר דיוקנאות מצוינים שנראים כמו תמונות - זה שדרוג בהשוואה לגרסה 1.5. האלגוריתם המשופר ב-SDXL Beta משפר את הפרטים ואת דיוק הצבעים של הפורטרטים, וכתוצאה מכך מראה טבעי ומציאותי יותר. משתמשים יכולים גם להתאים את רמות החדות והרוויה כדי להשיג את ההשפעות הרצויות להם.
דואוטון. מילת המפתח duotone תמיד מייצרת תמונות בשחור-לבן בדגם v1.5. עם זאת, כעת, תמונות הדואוטון המיוצרות על ידי SDXL Beta מגיעות במגוון צבעים. ברור שבהשוואה לדגמי v1, היכולת לפרש את ההנחיה השתפר, וכתוצאה מכך תגובות מדויקות ורלוונטיות יותר מדגמי v2, מה שהופך אותם לכלי אמין יותר למשימות עיבוד שפה טבעית.
סגנונות אמנותיים. היו כמה התאמות קטנות, אבל קשה לקבוע אם הדגם החדש מספק תוצאות טובות יותר מכיוון שהם פשוט ייחודיים. ייתכן שההתאמות הללו עשויות להיות עניין של העדפה אישית או דעה סובייקטיבית, מה שמקשה על ביצוע א defiשיפוט חדשני על איכותם. עם זאת, הייחודיות של ההתאמות עשויה להיות ראויה לציון וכדאי לחקור עוד.
סיכום
- Stable Diffusion יכול סוף סוף לייצר טקסט הגיוני.
- SDXL מספק תמונות אסתטיות יותר מדגמי v2.1 ו(במידה פחותה) מדגמי v1.5.
- הדגם החדש מייצר תמונות מדויקות יותר.
- האנטומיה של האדם השתפרה.
- הנחיות שליליות אינן נחוצות כמו בגרסה 2.1.
- זה יכול ליצור דיוקנאות מציאותיים.
- כמה מוזרויות בדגם יתוקנו לפני השחרור.
קרא עוד מאמרים קשורים:
כתב ויתור
בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.
על המחבר
דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט.
מאמרים נוספיםדמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט.