דיווח חדשות טכנולוגיה
אוקטובר 10, 2023

מיקרוסופט אילצה את ה-LLMs לשכוח מהארי פוטר

מיקרוסופט אילצה את ה-LLMs לשכוח מהארי פוטר
מקור: Dall-E 3

מיקרוסופט חשפה שיטה על הנחיה למודלים של שפה גדולה (LLMs) לשכוח מידע ספציפי בתוך מערכי הנתונים שלהם מבלי לדרוש שחזור מלא של נתוני ההדרכה. שיטה זו פותחת אפשרויות חדשות לשיפור LLMs ואפשרות לפתור בעיות משפטיות הקשורות לתוכן המוגן בזכויות יוצרים.

הצוות של מיקרוסופט הדגים לאחרונה כיצד הם הצליחו ליצור את Llamaמודל -2 תשכח את הפרטים של ספרי הארי פוטר מבלי להשפיע על נתונים אחרים בנתוני האימון של המודל או על הביצועים הכוללים של המודל במחקר המתואר בדף פרויקט המחקר שלהם.

התהליך מתחיל בזיהוי של מידע ספציפי בתוך מערך הנתונים של המודל שצריך לשכוח. במקרה זה, מדובר בפרטים הקשורים לסדרה האיקונית של ג'יי קיי רולינג, כולל פרטי עלילה, שמות דמויות וציטוטים מפורסמים. אלה הוחלפו לאחר מכן באופן שיטתי בביטויים גנריים, לא קשורים.

לאחר מכן השתמשו החוקרים במודל שפה כדי ליצור מידע חדש על סמך נתונים גנריים אלה. הנתונים הטריים האלה שימשו לאחר מכן כדי להכשיר מחדש את המקור Llama-2 דגם בהדרגה. עם כל צעד, הדוגמנית התרחקה מספרי הארי פוטר עד שהחלה לייצר תגובות הזויות כשנשאלה עליהן.

תכונה בולטת אחת של גישה זו היא שהיא אינה מתפשרת על הביצועים הכלליים של הדגם. המשמעות היא שבעוד שה-LLM הופך יותר ויותר שכחני לגבי נתונים ספציפיים, יכולות השפה הכוללות שלו נשארות ללא פגע.

למרות העובדה שגישה זו עדיין מתעדנת, השלכותיה רחבות היקף. במצבים הכוללים תביעות משפטיות ובעיות זכויות יוצרים, בפרט, זה עשוי לספק חבל הצלה למי שיוצר LLMs ומודלים אחרים של AI.

החידוש הזה מגיע בזמן שבו מחלוקות משפטיות על השימוש בתוכן המוגן בזכויות יוצרים במודלים של AI נמצאים במגמת עלייה. לדוגמה, ה"ניו יורק טיימס" דרש לאחרונה את ההסרה של פרסומיו מ- GPT-4 מערך נתונים. במקרה של הצלחה אתגר משפטי, מפתחים יצטרכו בדרך כלל לשחזר את מערכי הנתונים של המודל שלהם, תהליך שגוזל זמן ועתיר משאבים. השיטה של ​​מיקרוסופט, אם תשוכלל ותאמץ עוד יותר, תוכל לספק פתרון יעיל לאתגרים כאלה.

השיטה של ​​מיקרוסופט לשכוח באופן סלקטיבי מידע ספציפי בתוך מודלים של שפה גדולה (לימודי תואר שני) מהווה פריצת דרך משמעותית בפיתוח בינה מלאכותית, שעשוי לטפל בבעיות תוכן המוגן בזכויות יוצרים ולייעל חידוד. ניתן ליישם גישה זו בתחומים שונים, תוך הדגמה של פיתוח ויישום בינה מלאכותית אחראית.

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
אספרסו סיסטמס משתפת פעולה עם מעבדות פוליגון כדי לפתח את AggLayer לשיפור יכולת הפעולה ההדדית של אוסף
עסקים דיווח חדשות טכנולוגיה
אספרסו סיסטמס משתפת פעולה עם מעבדות פוליגון כדי לפתח את AggLayer לשיפור יכולת הפעולה ההדדית של אוסף
מאי 9, 2024
פרוטוקול תשתית מופעל על ידי ZKP ZKBase חושף מפת דרכים, מתכנן השקת Testnet במאי
דיווח חדשות טכנולוגיה
פרוטוקול תשתית מופעל על ידי ZKP ZKBase חושף מפת דרכים, מתכנן השקת Testnet במאי
מאי 9, 2024
BLOCKCHANCE ו-CONF3RENCE מתאחדים לגדולים בגרמניה Web3 ועידה בדורטמונד
עסקים שוקי תוכנה סיפורים וסקירות טכנולוגיה
BLOCKCHANCE ו-CONF3RENCE מתאחדים לגדולים בגרמניה Web3 ועידה בדורטמונד
מאי 9, 2024
NuLink משיקה ב-Bybit Web3 פלטפורמת IDO. שלב המנוי מתארך עד ה-13 במאי
שוקי דיווח חדשות טכנולוגיה
NuLink משיקה ב-Bybit Web3 פלטפורמת IDO. שלב המנוי מתארך עד ה-13 במאי
מאי 9, 2024
CRYPTOMERIA LABS PTE. בע"מ.