דיווח חדשות טכנולוגיה
פברואר 06, 2023

XLM-V: שיטה חדשה של מודלים רב-לשוניים של שפות מסכות המנסה לטפל בבעיית צוואר הבקבוק של אוצר המילים

בקיצור

המאמר מעלה את הבעיה הבאה: מודלים של שפה עלייה בפרמטרים, גדלה לעומק, אבל אוצר המילים עדיין זהה בגודלו.

חוקרים מתחילים לאמן מודל חדש עם מיליון אסימונים מאוצר המילים בצורה בלתי צפויה.

החוקרים היו נחושים לראות איזה סוג של שיפור הם יכולים לעשות עם עלייה כה משמעותית באסימונים.

הנושא שהועלה על ידי ה מאמר הכותרת "XLM-V: Overcoming the Vocabulary Bottling in Multilingual Masked Language Models" הוא שכאשר הפרמטרים והעומק של מודלים של שפה גדלים, גודל אוצר המילים שלהם נשאר ללא שינוי. לדוגמה, למודל mT5 יש 13B פרמטרים אך אוצר מילים של 250K מילים התומך ביותר מ-100 שפות. לפיכך, לכל שפה יש כ-2,500 אסימונים ייחודיים, וזה כמובן מספר קטן מאוד.

XLM-V: שיטה חדשה למודלים של שפה מסכת רב-לשונית המנסה לטפל בבעיית צוואר הבקבוק של אוצר המילים
@ Midjourney / שלוו

איזו פעולה נוקטים המחברים? הם מתחילים לאמן מודל חדש עם מיליון אסימונים מאוצר המילים בצורה בלתי צפויה. XLM-R היה קיים בעבר, אולם עם השדרוג הזה, הוא יהפוך ל-XLM-V. הכותבים היו נחושים לראות איזה סוג של שיפור הם יכולים לעשות עם עלייה כה משמעותית באסימונים.

כתבות קשורות: עלויות הדרכה של מודל בינה מלאכותית צפויות לעלות מ-100 מיליון דולר ל-500 מיליון דולר עד 2030

מה לגבי XLM-V הוא חדש ש-XLM-R לא?

מה לגבי XLM-V הוא חדש ש-XLM-R לא?

השיפור מודלים רב לשוניים שיטת עם Language-Clustered Vocabularars משמשת לבניית וקטורי ייצוג מילוני לכל שפה באופן הבא: עבור כל שפה בקבוצת השפות, הם מרכיבים וקטור בינארי, שכל אלמנט שלו הוא מילה ספציפית בשפה. האחת מציינת שהמילה כלולה במילון השפה (ניתן להציג תמונה עם תיאור גרפי בקבצים המצורפים). עם זאת, על ידי יצירת וקטור תוך שימוש בהסתברות הלוגריתמית השלילית להתרחשות של כל לקסמה, המחברים משפרים את אופן יצירת הפניות .

  1. הווקטורים מקובצים לאחר מכן. בנוסף, מודל משפט מאומן על כל אשכול מסוים כדי לעצור את העברת אוצר המילים בין שפות לא קשורות מבחינה מילונית.
  2. ה-ALP מעריך את יכולתו של מילון לייצג שפה מסוימת.
  3. ניצול האלגוריתם ליצירה Ulm מילונים הוא השלב הבא. שמתחיל במילון ראשוני גדול ומקטין אותו בהדרגה עד שמספר האסימונים מתחת לסף מסוים לגודל המילון.

קרא עוד על AI:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
Injective מאחדת כוחות עם AltLayer כדי להביא אבטחה מחדש ל-inEVM
עסקים דיווח חדשות טכנולוגיה
Injective מאחדת כוחות עם AltLayer כדי להביא אבטחה מחדש ל-inEVM
מאי 3, 2024
מאסה משתפת פעולה עם Teller כדי להציג את מאגר ההלוואות של MASA, מאפשרת הלוואות ב-USDC על בסיס
שוקי דיווח חדשות טכנולוגיה
מאסה משתפת פעולה עם Teller כדי להציג את מאגר ההלוואות של MASA, מאפשרת הלוואות ב-USDC על בסיס
מאי 3, 2024
Velodrome משיקה את גרסת הבטא של Superchain בשבועות הקרובים ומתרחבת ברחבי OP Stack Layer 2 Blockchains
שוקי דיווח חדשות טכנולוגיה
Velodrome משיקה את גרסת הבטא של Superchain בשבועות הקרובים ומתרחבת ברחבי OP Stack Layer 2 Blockchains
מאי 3, 2024
CARV מכריזה על שותפות עם Aethir לביזור שכבת הנתונים שלה ולחלוקת תגמולים
עסקים דיווח חדשות טכנולוגיה
CARV מכריזה על שותפות עם Aethir לביזור שכבת הנתונים שלה ולחלוקת תגמולים
מאי 3, 2024
CRYPTOMERIA LABS PTE. בע"מ.