OpenAI מרכיב צוות של 50+ מומחים לשיפור GPT-4הבטיחות של
בקיצור
OpenAI שכרה צוות של למעלה מ-50 מומחים כדי להבטיח שהחדש ביותר שלו מודל שפה, GPT-4, בטוח לשימוש.
הצוות כולל חוקרים ומהנדסים המתמחים בבטיחות, אתיקה ומדיניות בינה מלאכותית.
המטרה היא למנוע GPT-4 מיצירת תוכן מזיק או מוטה ולהבטיח שהוא מתיישב עם הערכים האנושיים.
OpenAI שכרה למעלה מ-50 מומחים מתחומים שונים לעשות GPT-4 בטוח יותר. המומחים עבדו עם בדיקות יריבות של המודל כדי לזהות סיכונים ופגיעות פוטנציאליים. הם מומחים מתחומים שונים: סיכוני יישור בינה מלאכותית לטווח ארוך, אבטחת סייבר, סיכונים ביולוגיים ואבטחה בינלאומית. הממצאים שלהם עזרו OpenAI להעריך התנהגות מודל בתחומי סיכון גבוה הדורשים מומחיות נישה.
בעוד שמודל השפה החדש ביותר מהווה סיכונים דומים למודלים של שפה קטנים יותר, היכולות הנוספות של GPT-4 להוביל לאיומים חדשים. לפיכך, ההתקשרות של מומחים הייתה חיוני בהבטחת בטיחות הטכנולוגיה.
OpenAI הטמיעה מערך נוסף של לימוד חיזוק רלוונטי לבטיחות מההעדפות האנושיות (RLHF) ומודלים מבוססי כללים (RBRMs) כדי לשפר את הבטיחות של GPT-4 דֶגֶם. RBRMs הם אפס ירי GPT-4 מסווגים שמתפקדים כאות תגמול נוסף עבור GPT-4 מודל מדיניות במהלך כוונון עדין של RLHF. מטרתם היא לתמרץ התנהגות הולמת, כמו דחיית יצירת תוכן מזיק או אי דחיית בקשות לא מזיקות.
כדי להבטיח את בטיחות ה GPT-4 מודלים, OpenAI החלה לגייס מומחים חיצוניים באוגוסט 2022 לביצוע תרגילי "צוות אדומים", כולל מבחני מאמץ, בדיקות גבולות ומבחנים יריבים. הייתה להם גישה לגרסאות מוקדמות של GPT-4 מודל וזיהה סיכונים ראשוניים שהניעו מחקר בטיחות נוסף.
המשוב של המומחים הוביל להפחתות טכניות ולאמצעי אכיפת מדיניות להפחתת סיכונים. עם זאת, נותרו איומים רבים, ויש צורך בהערכה נוספת.
מדברים על עובדים ב OpenAI, ChatGPT היה בהתחלה מפותח באמצעות סיוע מאנשים בכמה מהאזורים העניים בעולם OpenAIשותפות של חברה בשם Sama, המעסיקה מיליוני עובדים מאזורים עניים. כמה מומחים באתיקה של AI מתחו ביקורת OpenAIהחלטתו של מיקור חוץ להכשרתו ChatGPT מודל לסמא, מאשים את החברה בניצול כוח אדם בעלות נמוכה.
קרא עוד:
כתב ויתור
בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.
על המחבר
אגנה היא עיתונאית שמסקרת את המגמות וההתפתחויות האחרונות ב-metaverse, AI, ו Web3 תעשיות עבור Metaverse Post. התשוקה שלה לספר סיפורים הובילה אותה לערוך ראיונות רבים עם מומחים בתחומים אלה, כשהם מחפשים תמיד לחשוף סיפורים מרגשים ומרתקים. אגנה היא בעלת תואר ראשון בספרות ובעלת רקע נרחב בכתיבה על מגוון רחב של נושאים לרבות נסיעות, אמנות ותרבות. היא גם התנדבה כעורכת בארגון לזכויות בעלי חיים, שם סייעה להעלות את המודעות לנושאים של רווחת בעלי חיים. צור איתה קשר [מוגן בדוא"ל].
מאמרים נוספיםאגנה היא עיתונאית שמסקרת את המגמות וההתפתחויות האחרונות ב-metaverse, AI, ו Web3 תעשיות עבור Metaverse Post. התשוקה שלה לספר סיפורים הובילה אותה לערוך ראיונות רבים עם מומחים בתחומים אלה, כשהם מחפשים תמיד לחשוף סיפורים מרגשים ומרתקים. אגנה היא בעלת תואר ראשון בספרות ובעלת רקע נרחב בכתיבה על מגוון רחב של נושאים לרבות נסיעות, אמנות ותרבות. היא גם התנדבה כעורכת בארגון לזכויות בעלי חיים, שם סייעה להעלות את המודעות לנושאים של רווחת בעלי חיים. צור איתה קשר [מוגן בדוא"ל].