דיווח חדשות טכנולוגיה
במרץ 15, 2023

OpenAI מרכיב צוות של 50+ מומחים לשיפור GPT-4הבטיחות של

בקיצור

OpenAI שכרה צוות של למעלה מ-50 מומחים כדי להבטיח שהחדש ביותר שלו מודל שפה, GPT-4, בטוח לשימוש.

הצוות כולל חוקרים ומהנדסים המתמחים בבטיחות, אתיקה ומדיניות בינה מלאכותית.

המטרה היא למנוע GPT-4 מיצירת תוכן מזיק או מוטה ולהבטיח שהוא מתיישב עם הערכים האנושיים.

OpenAI מרכיב צוות של 50+ מומחים לשיפור GPT-4הבטיחות של

OpenAI שכרה למעלה מ-50 מומחים מתחומים שונים לעשות GPT-4 בטוח יותר. המומחים עבדו עם בדיקות יריבות של המודל כדי לזהות סיכונים ופגיעות פוטנציאליים. הם מומחים מתחומים שונים: סיכוני יישור בינה מלאכותית לטווח ארוך, אבטחת סייבר, סיכונים ביולוגיים ואבטחה בינלאומית. הממצאים שלהם עזרו OpenAI להעריך התנהגות מודל בתחומי סיכון גבוה הדורשים מומחיות נישה. 

בעוד שמודל השפה החדש ביותר מהווה סיכונים דומים למודלים של שפה קטנים יותר, היכולות הנוספות של GPT-4 להוביל לאיומים חדשים. לפיכך, ההתקשרות של מומחים הייתה חיוני בהבטחת בטיחות הטכנולוגיה.

OpenAI הטמיעה מערך נוסף של לימוד חיזוק רלוונטי לבטיחות מההעדפות האנושיות (RLHF) ומודלים מבוססי כללים (RBRMs) כדי לשפר את הבטיחות של GPT-4 דֶגֶם. RBRMs הם אפס ירי GPT-4 מסווגים שמתפקדים כאות תגמול נוסף עבור GPT-4 מודל מדיניות במהלך כוונון עדין של RLHF. מטרתם היא לתמרץ התנהגות הולמת, כמו דחיית יצירת תוכן מזיק או אי דחיית בקשות לא מזיקות.

כדי להבטיח את בטיחות ה GPT-4 מודלים, OpenAI החלה לגייס מומחים חיצוניים באוגוסט 2022 לביצוע תרגילי "צוות אדומים", כולל מבחני מאמץ, בדיקות גבולות ומבחנים יריבים. הייתה להם גישה לגרסאות מוקדמות של GPT-4 מודל וזיהה סיכונים ראשוניים שהניעו מחקר בטיחות נוסף.

המשוב של המומחים הוביל להפחתות טכניות ולאמצעי אכיפת מדיניות להפחתת סיכונים. עם זאת, נותרו איומים רבים, ויש צורך בהערכה נוספת.

מדברים על עובדים ב OpenAI, ChatGPT היה בהתחלה מפותח באמצעות סיוע מאנשים בכמה מהאזורים העניים בעולם OpenAIשותפות של חברה בשם Sama, המעסיקה מיליוני עובדים מאזורים עניים. כמה מומחים באתיקה של AI מתחו ביקורת OpenAIהחלטתו של מיקור חוץ להכשרתו ChatGPT מודל לסמא, מאשים את החברה בניצול כוח אדם בעלות נמוכה.

קרא עוד:

תגיות:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

אגנה היא עיתונאית שמסקרת את המגמות וההתפתחויות האחרונות ב-metaverse, AI, ו Web3 תעשיות עבור Metaverse Post. התשוקה שלה לספר סיפורים הובילה אותה לערוך ראיונות רבים עם מומחים בתחומים אלה, כשהם מחפשים תמיד לחשוף סיפורים מרגשים ומרתקים. אגנה היא בעלת תואר ראשון בספרות ובעלת רקע נרחב בכתיבה על מגוון רחב של נושאים לרבות נסיעות, אמנות ותרבות. היא גם התנדבה כעורכת בארגון לזכויות בעלי חיים, שם סייעה להעלות את המודעות לנושאים של רווחת בעלי חיים. צור איתה קשר [מוגן בדוא"ל].

מאמרים נוספים
אגנה צימרמן
אגנה צימרמן

אגנה היא עיתונאית שמסקרת את המגמות וההתפתחויות האחרונות ב-metaverse, AI, ו Web3 תעשיות עבור Metaverse Post. התשוקה שלה לספר סיפורים הובילה אותה לערוך ראיונות רבים עם מומחים בתחומים אלה, כשהם מחפשים תמיד לחשוף סיפורים מרגשים ומרתקים. אגנה היא בעלת תואר ראשון בספרות ובעלת רקע נרחב בכתיבה על מגוון רחב של נושאים לרבות נסיעות, אמנות ותרבות. היא גם התנדבה כעורכת בארגון לזכויות בעלי חיים, שם סייעה להעלות את המודעות לנושאים של רווחת בעלי חיים. צור איתה קשר [מוגן בדוא"ל].

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
Injective מאחדת כוחות עם AltLayer כדי להביא אבטחה מחדש ל-inEVM
עסקים דיווח חדשות טכנולוגיה
Injective מאחדת כוחות עם AltLayer כדי להביא אבטחה מחדש ל-inEVM
מאי 3, 2024
מאסה משתפת פעולה עם Teller כדי להציג את מאגר ההלוואות של MASA, מאפשרת הלוואות ב-USDC על בסיס
שוקי דיווח חדשות טכנולוגיה
מאסה משתפת פעולה עם Teller כדי להציג את מאגר ההלוואות של MASA, מאפשרת הלוואות ב-USDC על בסיס
מאי 3, 2024
Velodrome משיקה את גרסת הבטא של Superchain בשבועות הקרובים ומתרחבת ברחבי OP Stack Layer 2 Blockchains
שוקי דיווח חדשות טכנולוגיה
Velodrome משיקה את גרסת הבטא של Superchain בשבועות הקרובים ומתרחבת ברחבי OP Stack Layer 2 Blockchains
מאי 3, 2024
CARV מכריזה על שותפות עם Aethir לביזור שכבת הנתונים שלה ולחלוקת תגמולים
עסקים דיווח חדשות טכנולוגיה
CARV מכריזה על שותפות עם Aethir לביזור שכבת הנתונים שלה ולחלוקת תגמולים
מאי 3, 2024
CRYPTOMERIA LABS PTE. בע"מ.