דיווח חדשות
06 בנובמבר 2022

ERNIE-ViLG 2.0: דגם הטקסט לתמונה החדש מבית Baidu עולה על Dalle-2 ו Stable Diffusion

בקיצור

גם Dalle-2 וגם Stable Diffusion קיבלו ביצועים טובים יותר מ-ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 הוא מודל טקסט לתמונה המציע ביצועים טובים יותר מאשר Dalle-2 ו Stable Diffusion, שניים מהדגמים הפופולריים ביותר של טקסט לתמונה הזמינים כרגע. הדגם החדש תוכנן והוכשר על ידי צוות חוקרים מ-Baidu, והתוצאות עוצרות נשימה.

דגם הטקסט לתמונה החדש ERNIE-ViLG 2.0 מתעלה על Dalle-2 ו Stable Diffusion
התמונה שנוצרה על ידי ERNIE-ViLG 2.0

התוצאות הוכיחו ש-ERNIE-ViLG 2.0 עלה משמעותית על Dalle-2 ו Stable Diffusion. זהו הישג משמעותי ומדגים את כוחה של מסגרת ERNIE. ה Metaverse Post הצוות השווה את ERNIE-ViLG 2.0 עם Stable Diffusion להלן:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

תוצאות אלו מספקות תמיכה חזקה להשערה כי ERNIE-ViLG 2.0 הוא יעיל יותר מערכת טקסט לתמונה מאשר גם Dalle-2 וגם Stable Diffusion.

ארכיטקטורת Unet מ Stable Diffusion נלקח כבסיס, אך עם שינויים:

  • תערובת של מומחי גנאי: ישנן 10 רשתות עצביות במקום רק אחת, כאשר כל אחת אחראית רק על שלבי דיפוזיה מסוימים.
  • ידע טקסטואלי: שקלו מחדש אוטומטית את המילים בשאילתה כך שמילות מפתח יקבלו משקל רב יותר.
  • ידע חזותי: במהלך האימון זוהו חפצים בתוצאות דור ביניים, ומשקל פונקציית ההפסד באזורים עם חפצים גדל.

כתוצאה מכך, הגדול בעולם מודל טקסט לתמונה יצא עם 24 מיליארד פרמטרים (פי 10 יותר מ-SD) כדי להכשיר את המודל.

בהשוואה לדגמים קודמים, ERNIE-ViLG 2.0 עולה עליהם במידה ניכרת מבחינת איכות התמונה והתאמת תמונה לטקסט כאשר נבדק בו-זמנית על ה-ViLG-300 הדו-לשוני הפקודה שנקבע על ידי אדם.

ההנחיות מתורגמות בפשטות מסינית לאנגלית באופן אוטומטי ב- חיבוק פנים הדגמה ציבורית לפני שליחתו ל-AI. הרבה תכונות נובעות מכך.

  • ארני אינו מכיר אישי ציבור בינלאומיים. למשל, ארני לא מכיר את ארנולד שוורצנגר. אין ספק שיש לו מועדפים מקומיים בסין.
  • כתוצאה מכך, שיטת השימוש בשמות מפורסמים מבקשת להגביר באופן דרמטי את האיכות של פנים נכשל.
  • אתה יכול לצפות לעיוות מסוים בגלל התרגום מסינית, אז אולי יהיו לך כמה הפתעות אם אינך דובר סינית.
  • זה אפילו לא יודע כלום על גרג רוטקובסקי.

קרא מאמרים קשורים:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories

BRICS Nations Eye Stablecoin פתרון סחר

by ויקטוריה פלצ'יק
מאי 01, 2024
הצטרף לניוזלטר שלנו.
חדשות אחרונות

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר

מייסדי ארנק סמוראי הואשמו בהנחיית 2 מיליארד דולר בעסקאות Darknet

החשש של מייסדי ארנק סמוראי מייצג כישלון בולט עבור התעשייה, המדגיש את ...

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קרא עוד
Ankr משתפת פעולה עם AI Blockchain Platform Talus Network כדי לפתוח את נזילות הביטקוין עבור AI
עסקים דיווח חדשות טכנולוגיה
Ankr משתפת פעולה עם AI Blockchain Platform Talus Network כדי לפתוח את נזילות הביטקוין עבור AI
מאי 1, 2024
Binance Labs תומכת במעבדות תנועה כדי להקל על שילוב המהלך של פייסבוק על פני בלוקצ'יין
עסקים דיווח חדשות טכנולוגיה
Binance Labs תומכת במעבדות תנועה כדי להקל על שילוב המהלך של פייסבוק על פני בלוקצ'יין
מאי 1, 2024
BRICS Nations Eye Stablecoin פתרון סחר
עסקים שוקי סיפורים וסקירות טכנולוגיה
BRICS Nations Eye Stablecoin פתרון סחר
מאי 1, 2024
Bitcoin L2 Network BOB משתלב עם LayerZero לפונקציונליות משופרת
עסקים דיווח חדשות טכנולוגיה
Bitcoin L2 Network BOB משתלב עם LayerZero לפונקציונליות משופרת
מאי 1, 2024
CRYPTOMERIA LABS PTE. בע"מ.