דיווח חדשות טכנולוגיה
אוקטובר 10, 2023

מיקרוסופט אילצה את ה-LLMs לשכוח מהארי פוטר

מיקרוסופט אילצה את ה-LLMs לשכוח מהארי פוטר
מקור: Dall-E 3

מיקרוסופט חשפה שיטה על הנחיה למודלים של שפה גדולה (LLMs) לשכוח מידע ספציפי בתוך מערכי הנתונים שלהם מבלי לדרוש שחזור מלא של נתוני ההדרכה. שיטה זו פותחת אפשרויות חדשות לשיפור LLMs ואפשרות לפתור בעיות משפטיות הקשורות לתוכן המוגן בזכויות יוצרים.

הצוות של מיקרוסופט הדגים לאחרונה כיצד הם הצליחו ליצור את Llamaמודל -2 תשכח את הפרטים של ספרי הארי פוטר מבלי להשפיע על נתונים אחרים בנתוני האימון של המודל או על הביצועים הכוללים של המודל במחקר המתואר בדף פרויקט המחקר שלהם.

התהליך מתחיל בזיהוי של מידע ספציפי בתוך מערך הנתונים של המודל שצריך לשכוח. במקרה זה, מדובר בפרטים הקשורים לסדרה האיקונית של ג'יי קיי רולינג, כולל פרטי עלילה, שמות דמויות וציטוטים מפורסמים. אלה הוחלפו לאחר מכן באופן שיטתי בביטויים גנריים, לא קשורים.

לאחר מכן השתמשו החוקרים במודל שפה כדי ליצור מידע חדש על סמך נתונים גנריים אלה. הנתונים הטריים האלה שימשו לאחר מכן כדי להכשיר מחדש את המקור Llama-2 דגם בהדרגה. עם כל צעד, הדוגמנית התרחקה מספרי הארי פוטר עד שהחלה לייצר תגובות הזויות כשנשאלה עליהן.

תכונה בולטת אחת של גישה זו היא שהיא אינה מתפשרת על הביצועים הכלליים של הדגם. המשמעות היא שבעוד שה-LLM הופך יותר ויותר שכחני לגבי נתונים ספציפיים, יכולות השפה הכוללות שלו נשארות ללא פגע.

למרות העובדה שגישה זו עדיין מתעדנת, השלכותיה רחבות היקף. במצבים הכוללים תביעות משפטיות ובעיות זכויות יוצרים, בפרט, זה עשוי לספק חבל הצלה למי שיוצר LLMs ומודלים אחרים של AI.

החידוש הזה מגיע בזמן שבו מחלוקות משפטיות על השימוש בתוכן המוגן בזכויות יוצרים במודלים של AI נמצאים במגמת עלייה. לדוגמה, ה"ניו יורק טיימס" דרש לאחרונה את ההסרה של פרסומיו מ- GPT-4 מערך נתונים. במקרה של הצלחה אתגר משפטי, מפתחים יצטרכו בדרך כלל לשחזר את מערכי הנתונים של המודל שלהם, תהליך שגוזל זמן ועתיר משאבים. השיטה של ​​מיקרוסופט, אם תשוכלל ותאמץ עוד יותר, תוכל לספק פתרון יעיל לאתגרים כאלה.

השיטה של ​​מיקרוסופט לשכוח באופן סלקטיבי מידע ספציפי בתוך מודלים של שפה גדולה (לימודי תואר שני) מהווה פריצת דרך משמעותית בפיתוח בינה מלאכותית, שעשוי לטפל בבעיות תוכן המוגן בזכויות יוצרים ולייעל חידוד. ניתן ליישם גישה זו בתחומים שונים, תוך הדגמה של פיתוח ויישום בינה מלאכותית אחראית.

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

מ-Ripple ל-DAO הירוק הגדול: כיצד פרויקטים של מטבעות קריפטו תורמים לצדקה

בואו לחקור יוזמות המנצלות את הפוטנציאל של מטבעות דיגיטליים למטרות צדקה.

יודע יותר

AlphaFold 3, Med-Gemini ואחרים: הדרך בינה מלאכותית משנה את שירותי הבריאות ב-2024

בינה מלאכותית מתבטאת בדרכים שונות בתחום הבריאות, מחשיפת מתאמים גנטיים חדשים ועד העצמת מערכות כירורגיות רובוטיות...

יודע יותר
למידע נוסף
קראו עוד
DEXX מתחייבת לפצות משתמשים על הפסדים בעקבות פריצה של 21 מיליון דולר
דיווח חדשות טכנולוגיה
DEXX מתחייבת לפצות משתמשים על הפסדים בעקבות פריצה של 21 מיליון דולר
דצמבר 6, 2024
עתיד הפרטיות על בלוקצ'יין ציבורי וכיצד COTI סוללת את הדרך למערכות מבוזרות מאובטחות
ראיון אישי עסקים שוקי תוכנה טכנולוגיה
עתיד הפרטיות על בלוקצ'יין ציבורי וכיצד COTI סוללת את הדרך למערכות מבוזרות מאובטחות
דצמבר 6, 2024
Binance להוסיף על פני פרוטוקול ואסימונים של Orca כדי להרוויח, לקנות קריפטו, להמיר, מרווח וחוזים עתידיים
דיווח חדשות טכנולוגיה
Binance להוסיף על פני פרוטוקול ואסימונים של Orca כדי להרוויח, לקנות קריפטו, להמיר, מרווח וחוזים עתידיים
דצמבר 6, 2024
מארנקים קוונטיים לתשלומי קריפטו יוקרתיים, שותפויות נועזות מובילות את העתיד של בלוקצ'יין
תקציר עסקים שוקי תוכנה טכנולוגיה
מארנקים קוונטיים לתשלומי קריפטו יוקרתיים, שותפויות נועזות מובילות את העתיד של בלוקצ'יין
דצמבר 6, 2024
CRYPTOMERIA LABS PTE. בע"מ.