דיווח חדשות
06 בנובמבר 2022

ERNIE-ViLG 2.0: דגם הטקסט לתמונה החדש מבית Baidu עולה על Dalle-2 ו Stable Diffusion

בקיצור

גם Dalle-2 וגם Stable Diffusion קיבלו ביצועים טובים יותר מ-ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 הוא מודל טקסט לתמונה המציע ביצועים טובים יותר מאשר Dalle-2 ו Stable Diffusion, שניים מהדגמים הפופולריים ביותר של טקסט לתמונה הזמינים כרגע. הדגם החדש תוכנן והוכשר על ידי צוות חוקרים מ-Baidu, והתוצאות עוצרות נשימה.

דגם הטקסט לתמונה החדש ERNIE-ViLG 2.0 מתעלה על Dalle-2 ו Stable Diffusion
התמונה שנוצרה על ידי ERNIE-ViLG 2.0

התוצאות הוכיחו ש-ERNIE-ViLG 2.0 עלה משמעותית על Dalle-2 ו Stable Diffusion. זהו הישג משמעותי ומדגים את כוחה של מסגרת ERNIE. ה Metaverse Post הצוות השווה את ERNIE-ViLG 2.0 עם Stable Diffusion להלן:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

תוצאות אלו מספקות תמיכה חזקה להשערה כי ERNIE-ViLG 2.0 הוא יעיל יותר מערכת טקסט לתמונה מאשר גם Dalle-2 וגם Stable Diffusion.

ארכיטקטורת Unet מ Stable Diffusion נלקח כבסיס, אך עם שינויים:

  • תערובת של מומחי גנאי: ישנן 10 רשתות עצביות במקום רק אחת, כאשר כל אחת אחראית רק על שלבי דיפוזיה מסוימים.
  • ידע טקסטואלי: שקלו מחדש אוטומטית את המילים בשאילתה כך שמילות מפתח יקבלו משקל רב יותר.
  • ידע חזותי: במהלך האימון זוהו חפצים בתוצאות דור ביניים, ומשקל פונקציית ההפסד באזורים עם חפצים גדל.

כתוצאה מכך, הגדול בעולם מודל טקסט לתמונה יצא עם 24 מיליארד פרמטרים (פי 10 יותר מ-SD) כדי להכשיר את המודל.

בהשוואה לדגמים קודמים, ERNIE-ViLG 2.0 עולה עליהם במידה ניכרת מבחינת איכות התמונה והתאמת תמונה לטקסט כאשר נבדק בו-זמנית על ה-ViLG-300 הדו-לשוני הפקודה שנקבע על ידי אדם.

ההנחיות מתורגמות בפשטות מסינית לאנגלית באופן אוטומטי ב- חיבוק פנים הדגמה ציבורית לפני שליחתו ל-AI. הרבה תכונות נובעות מכך.

  • ארני אינו מכיר אישי ציבור בינלאומיים. למשל, ארני לא מכיר את ארנולד שוורצנגר. אין ספק שיש לו מועדפים מקומיים בסין.
  • כתוצאה מכך, שיטת השימוש בשמות מפורסמים מבקשת להגביר באופן דרמטי את האיכות של פנים נכשל.
  • אתה יכול לצפות לעיוות מסוים בגלל התרגום מסינית, אז אולי יהיו לך כמה הפתעות אם אינך דובר סינית.
  • זה אפילו לא יודע כלום על גרג רוטקובסקי.

קרא מאמרים קשורים:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
Injective מאחדת כוחות עם AltLayer כדי להביא אבטחה מחדש ל-inEVM
עסקים דיווח חדשות טכנולוגיה
Injective מאחדת כוחות עם AltLayer כדי להביא אבטחה מחדש ל-inEVM
מאי 3, 2024
מאסה משתפת פעולה עם Teller כדי להציג את מאגר ההלוואות של MASA, מאפשרת הלוואות ב-USDC על בסיס
שוקי דיווח חדשות טכנולוגיה
מאסה משתפת פעולה עם Teller כדי להציג את מאגר ההלוואות של MASA, מאפשרת הלוואות ב-USDC על בסיס
מאי 3, 2024
Velodrome משיקה את גרסת הבטא של Superchain בשבועות הקרובים ומתרחבת ברחבי OP Stack Layer 2 Blockchains
שוקי דיווח חדשות טכנולוגיה
Velodrome משיקה את גרסת הבטא של Superchain בשבועות הקרובים ומתרחבת ברחבי OP Stack Layer 2 Blockchains
מאי 3, 2024
CARV מכריזה על שותפות עם Aethir לביזור שכבת הנתונים שלה ולחלוקת תגמולים
עסקים דיווח חדשות טכנולוגיה
CARV מכריזה על שותפות עם Aethir לביזור שכבת הנתונים שלה ולחלוקת תגמולים
מאי 3, 2024
CRYPTOMERIA LABS PTE. בע"מ.