דיווח חדשות טכנולוגיה
במרץ 15, 2023

פייסבוק מפתחת שיטה חדשה להכפלת הביצועים של רובוטריקים בינה מלאכותית

בקיצור

פייסבוק פיתחה שיטה חדשה להכפלת הביצועים של שנאי בינה מלאכותית המבוססת על ארכיטקטורת השנאים.

השיטה החדשה מוצאת את הטלאים הדומים ביותר בפערים בין עיבוד בלוקים שונים ומשלבת אותם כדי להפחית את המורכבות החישובית.

פייסבוק פיתחה א שיטה חדשה להכפלת הביצועים של שנאי בינה מלאכותית. השיטה היא מבוסס על ארכיטקטורת השנאים והוא תוכנן במיוחד עבור טקסט ארוך, כגון ספרים, מאמרים ובלוגים. המטרה של שנאי ה-AI החדש היא לשפר את הביצועים של מודלים מבוססי שנאים על טקסט ארוך על ידי הפיכתם ליעילה ואפקטיבית יותר בטיפול ברצפים ארוכים. התוצאות של שנאי הבינה המלאכותית מבטיחות מאוד, ולשיטה החדשה הזו יש סיכוי לעזור לשפר את הביצועים של מודלים מבוססי שנאים במגוון משימות.

לשיטה חדשה זו צפויה להיות השפעה משמעותית על משימות עיבוד שפה טבעית, כגון תרגום שפה, סיכום ומערכות תשובות לשאלות. זה גם צפוי להוביל לפיתוח דגמי AI מתוחכמים יותר שיכולים להתמודד עם טקסטים ארוכים ומורכבים יותר.

פייסבוק פיתחה שיטה חדשה להכפלת הביצועים של שנאי בינה מלאכותית
קרא עוד: 10+ עורכי תמונות AI הטובים ביותר לשנת 2023: מקוונים וחינמיים

כדי לעבד את התמונה, שנאים מודרניים חותכים אותה לטלאים (בדרך כלל ריבועים: ראה את ה-GIF למטה) ואז פועלים על ייצוגים של חלקיקים אלה, שכל אחד מהם מיוצג על ידי "אסימון". רובוטריקים, כידוע, עובדים לאט יותר ככל שיש יותר חלקי אסימון אלה (זה חל גם על טקסטים וגם על תמונות), ולשנאי הנפוץ ביותר יש קשר ריבועי. כלומר, ככל שמתווספים יותר אסימונים, כך העיבוד נעשה איטי יותר. כדי לטפל בבעיה זו, חוקרים הציעו טכניקות שונות להפחתת מספר האסימונים הנדרשים לעיבוד תמונה, כגון איגום היררכי ואדפטיבי. שיטות אלו שואפות לשמור על איכות התפוקה תוך מזעור העלות החישובית.

השיטה החדשה מוצאת את הטלאים הדומים ביותר בפערים בין עיבוד בלוקים שונים ומשלבת אותם כדי להפחית את המורכבות החישובית. חלקם של אסימונים ממוזגים הוא היפרפרמטר; ככל שהוא גבוה יותר, האיכות נמוכה יותר אך גם התאוצה גבוהה יותר. ניסויים מראים כי ניתן למזג כ-40% מהטוקנים עם אובדן איכות של 0.1-0.4% ולקבל תאוצה כפולה (ובכך להכיל פחות זיכרון). שיטה חדשה זו מהווה פתרון מבטיח להפחתת המורכבות החישובית של עיבוד תמונה ויכולה לאפשר עיבוד מהיר ויעיל יותר מבלי לפגוע באיכות הפלט הסופי.

כאשר אנו מדמיינים אילו טלאים אנו מתמזגים, אנו יכולים לראות שהם 1) קרובים זה לזה ו-2) מתארים את אותו אובייקט (ראו אזורים באותו צבע ב-GIF). כלומר, לא אובד מידע משמעותי; האובייקט נשאר "בשדה הראייה" של הדגם. ככל שהדבר מיושם מאוחר יותר בשנאי, כך מתמזגים יותר אסימונים (שכן אלו ייצוגים ברמה גבוהה יותר שמתארים היטב את תוכן התמונה).

גישות הנדסיות כאלה המבוססות על כושר המצאה והבנה כיצד משהו עובד נראות מושכות מאוד. כמו כן, המפתחים של Meta מבטיחים להביא יותר ל-StableDiffusion על מנת לזרז את העניינים גם שם. זה מדהים שמכיוון ששנאים נמצאים בכל מקום, טריקים כאלה יכולים להיות מיושמים במהירות במגוון רחב של דגמים. זה מראה את הפוטנציאל של פתרונות הנדסיים להיות בעלי השפעה רחבה על פני תעשיות שונות. יהיה מעניין לראות כיצד ההתקדמות הללו נכנסות דגמי שנאים ימשיך להתפתח ולהשתפר עם הזמן.

  • Meta AI ו-Paperswithcode פרסמו את דגם ה-120B הראשון Galactica שאומן על טקסטים מדעיים, המאפשר תחזיות מדויקות ומהירות יותר. המטרה של גלקטיקה היא לעזור לחוקרים להפריד בין החשוב לבלתי רלוונטי.

קרא עוד חדשות קשורות:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
Injective מאחדת כוחות עם AltLayer כדי להביא אבטחה מחדש ל-inEVM
עסקים דיווח חדשות טכנולוגיה
Injective מאחדת כוחות עם AltLayer כדי להביא אבטחה מחדש ל-inEVM
מאי 3, 2024
מאסה משתפת פעולה עם Teller כדי להציג את מאגר ההלוואות של MASA, מאפשרת הלוואות ב-USDC על בסיס
שוקי דיווח חדשות טכנולוגיה
מאסה משתפת פעולה עם Teller כדי להציג את מאגר ההלוואות של MASA, מאפשרת הלוואות ב-USDC על בסיס
מאי 3, 2024
Velodrome משיקה את גרסת הבטא של Superchain בשבועות הקרובים ומתרחבת ברחבי OP Stack Layer 2 Blockchains
שוקי דיווח חדשות טכנולוגיה
Velodrome משיקה את גרסת הבטא של Superchain בשבועות הקרובים ומתרחבת ברחבי OP Stack Layer 2 Blockchains
מאי 3, 2024
CARV מכריזה על שותפות עם Aethir לביזור שכבת הנתונים שלה ולחלוקת תגמולים
עסקים דיווח חדשות טכנולוגיה
CARV מכריזה על שותפות עם Aethir לביזור שכבת הנתונים שלה ולחלוקת תגמולים
מאי 3, 2024
CRYPTOMERIA LABS PTE. בע"מ.