ERNIE-ViLG 2.0: דגם הטקסט לתמונה החדש מבית Baidu עולה על Dalle-2 ו Stable Diffusion
בקיצור
גם Dalle-2 וגם Stable Diffusion קיבלו ביצועים טובים יותר מ-ERNIE-ViLG 2.0
ERNIE-ViLG 2.0 הוא מודל טקסט לתמונה המציע ביצועים טובים יותר מאשר Dalle-2 ו Stable Diffusion, שניים מהדגמים הפופולריים ביותר של טקסט לתמונה הזמינים כרגע. הדגם החדש תוכנן והוכשר על ידי צוות חוקרים מ-Baidu, והתוצאות עוצרות נשימה.
התוצאות הוכיחו ש-ERNIE-ViLG 2.0 עלה משמעותית על Dalle-2 ו Stable Diffusion. זהו הישג משמעותי ומדגים את כוחה של מסגרת ERNIE. ה Metaverse Post הצוות השווה את ERNIE-ViLG 2.0 עם Stable Diffusion להלן:
תוצאות אלו מספקות תמיכה חזקה להשערה כי ERNIE-ViLG 2.0 הוא יעיל יותר מערכת טקסט לתמונה מאשר גם Dalle-2 וגם Stable Diffusion.
ארכיטקטורת Unet מ Stable Diffusion נלקח כבסיס, אך עם שינויים:
- תערובת של מומחי גנאי: ישנן 10 רשתות עצביות במקום רק אחת, כאשר כל אחת אחראית רק על שלבי דיפוזיה מסוימים.
- ידע טקסטואלי: שקלו מחדש אוטומטית את המילים בשאילתה כך שמילות מפתח יקבלו משקל רב יותר.
- ידע חזותי: במהלך האימון זוהו חפצים בתוצאות דור ביניים, ומשקל פונקציית ההפסד באזורים עם חפצים גדל.
כתוצאה מכך, הגדול בעולם מודל טקסט לתמונה יצא עם 24 מיליארד פרמטרים (פי 10 יותר מ-SD) כדי להכשיר את המודל.
ההנחיות מתורגמות בפשטות מסינית לאנגלית באופן אוטומטי ב- חיבוק פנים הדגמה ציבורית לפני שליחתו ל-AI. הרבה תכונות נובעות מכך.
- ארני אינו מכיר אישי ציבור בינלאומיים. למשל, ארני לא מכיר את ארנולד שוורצנגר. אין ספק שיש לו מועדפים מקומיים בסין.
- כתוצאה מכך, שיטת השימוש בשמות מפורסמים מבקשת להגביר באופן דרמטי את האיכות של פנים נכשל.
- אתה יכול לצפות לעיוות מסוים בגלל התרגום מסינית, אז אולי יהיו לך כמה הפתעות אם אינך דובר סינית.
- זה אפילו לא יודע כלום על גרג רוטקובסקי.
קרא מאמרים קשורים:
כתב ויתור
בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.
על המחבר
דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט.
מאמרים נוספיםדמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט.