דעה טכנולוגיה
אפריל 17, 2023

כל חברות הטכנולוגיה הגדולות המפתחות לימודי LLM צריכות לתת עדיפות לאבטחת המודל

בקיצור

חוקרים יצרו מערכת שמשלבת מודלים גדולים לשפה לתכנון, תכנון וביצוע אוטונומיים של ניסויים מדעיים, תוך הדגמת יכולות המחקר שלו בשלושה מקרים שונים.

המודל כתב קוד למשוואות כימיות כדי להבין כמה חומר נדרש לתגובה.

אל האני מאמר "יכולות מחקר מדעיות אוטונומיות מתעוררות של מודלים של שפה גדולים" בוחנת את הרעיון של יצירת מערכת המשלבת מספר מודלים של שפה גדולים לתכנון, תכנון וביצוע אוטונומיים של ניסויים מדעיים. הוא מדגים את יכולות המחקר של הסוכן בשלושה מקרים שונים, הקשה שבהם הוא יישום מוצלח של תגובות מזורזות.

כל חברות הטכנולוגיה הגדולות המפתחות לימודי LLM צריכות לתת עדיפות לאבטחת המודל
@Midjourney / Pouya MC#1465

התזה העיקרית של מאמר זה היא:

  1. חוקרים מצאו ספרייה המאפשרת לכתוב קוד ב-Python ולאחר מכן להעביר פקודות לביצוע למנגנון מיוחד לביצוע ניסויים (עם ערבוב חומרים);
  2. חוקרים השתמשו GPT-4 לחיפוש באינטרנט ותיעוד הספרייה, כמו גם ליכולת להריץ קוד Python (לביצוע ניסויים);
  3. יש מתזמן ברמה העליונה (גם GPT-4), המנתח את הבקשה המקורית ועורך "תוכנית מחקר".
  4. GPT-4 עושה עבודה טובה בביצוע משימות פשוטות לא כימיות כמו יצירת צורות מסוימות על לוח כימי (מילוי נכון של תאים בחומרים).
  5. הם ניסו משימה מורכבת ויישומית יותר של ביצוע תגובה; הדוגמנית התמודדה היטב והתנהגה בהיגיון.
  6. אחר כך הם נתנו למודל מספר משימות לביצוע ניסויים; עם זאת, על מה שהמודל נתן, לא בוצעו ניסויים אמיתיים.
  7. יתרה מכך, המודל כתב את הקוד למשוואות כימיות מספר פעמים כדי להעריך כמה חומר נדרש לתגובה.
  8. זה גם התבקש ליצור תרופה לסרטן. המודל ניגש לניתוח באופן הגיוני ומתודי. ראשית, הוא "חיפש" באינטרנט אחר מגמות עדכניות בגילוי תרופות אנטי סרטניות. לאחר מכן, המודל בחר מולקולה שתשמש ליצירת מודלים של התרופה וכתב את הקוד לסינתזה שלה. אנשים לא הפעילו את הקוד (ולא ראיתי ניתוח של התאמתו).
  9. בנוסף, הוא התבקש לסנתז כמה חומרים מסוכנים כמו סמים ורעלים.

הנה החלק המעניין ביותר. עבור כמה בקשות, הדוגמנית סירבה מיד לעבוד (למשל, גז הרואין או חרדל, גז רעיל מסוכן ביותר). עבור אחרים, היא התחילה לחפש בגוגל כיצד לייצר את החומרים, אך הבינה שניתן להשתמש בהם למטרות בלתי חוקיות וסירבה להמשיך לעבוד. עבור אחרים, הוא כתב תוכנית מחקר וקוד לסינתזת החומר.

"סירוב" זה כנראה בגלל GPT-4 נועד לנתח את הבקשה, ואם הוא מתבקש לעשות משהו לא חוקי או מסוכן, הוא מסרב מיד לבצע את הבקשה. זה ממש מגניב שהתוצאה של הליך היישור מורגשת.

ובסוף המאמר, המחברים דוחקים בגדול חברות המפתחות לימודי LLM לתת עדיפות לבטיחות הדגמים.

  • חוקרים מאוניברסיטת קליפורניה יצרו את מדד מקיאוולי למדוד את היכולת והנזק של מודלים של AI בסביבה רחבה של אינטראקציות שפה ארוכות טווח. בדיקה זו משתמשת בפתרונות ברמה גבוהה כדי להעניק לסוכנים מטרות מציאותיות ולהפשט אינטראקציות ברמה נמוכה.
  • המהפכה האינטלקטואלית בסימן ChatGPT הוא שלישייה של מהפכות נשגבות מבחינה סינרגטית: טכנולוגיות, טכנו-הומניטריות וסוציו-פוליטיות. כדי להסתכל בצורה מקיפה על המתרחש, מומלץ להקשיב שלוש נקודות מבט חדשות מאנשי רוח מתחומי הפילוסופיה, ההיסטוריה והחדשנות.
  • סיפור העצומה להפסיק לפתח מערכות AI מתקדמות יותר GPT-4 קוטב את החברה. מאמר מספק דוגמאות מתי תהליכים הולכים לכיוון בלתי צפוי. סיכונים של שימוש זדוני ב-AI ושימוש לרעה אינם נחשבים, מה שמוביל לטענה שאנחנו צריכים לפחד מאנשים ולא מ-AI עצמו.

קרא עוד על AI:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר

מייסדי ארנק סמוראי הואשמו בהנחיית 2 מיליארד דולר בעסקאות Darknet

החשש של מייסדי ארנק סמוראי מייצג כישלון בולט עבור התעשייה, המדגיש את ...

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קרא עוד
באפריל 2024 נראה שפל היסטורי בפריצות והונאות, CertiK מדווחת על ירידה של 141% ממרץ
שוקי אבטחה Wiki סיפורים וסקירות טכנולוגיה
באפריל 2024 נראה שפל היסטורי בפריצות והונאות, CertiK מדווחת על ירידה של 141% ממרץ
מאי 1, 2024
מחיר הביטקוין יורד לקראת הודעת החלטת הריבית של הפדרל ריזרב, אנליסטים מזהירים מפני שינוי פוטנציאלי בשוק
שוקי דיווח חדשות טכנולוגיה
מחיר הביטקוין יורד לקראת הודעת החלטת הריבית של הפדרל ריזרב, אנליסטים מזהירים מפני שינוי פוטנציאלי בשוק
מאי 1, 2024
PlayFi משלב MultiversX עבור Plug-and-Play Web3 חוויית משחקים
עסקים דיווח חדשות טכנולוגיה
PlayFi משלב MultiversX עבור Plug-and-Play Web3 חוויית משחקים
מאי 1, 2024
Galxe מציגה Passport V2 עם פרטיות וכלי אימות משופרים עבור Web3
דיווח חדשות טכנולוגיה
Galxe מציגה Passport V2 עם פרטיות וכלי אימות משופרים עבור Web3
אפריל 30, 2024
CRYPTOMERIA LABS PTE. בע"מ.