דיווח חדשות טכנולוגיה
יוני 01, 2023

OpenAI: מידול חדש של תגמול בפיקוח תהליכים משפר את נימוק הבינה המלאכותית

בקיצור

OpenAIמודל התגמול בפיקוח התהליך (PRM) של החברה נועד להעריך את שלבי הביניים וההיגיון של מודלים של AI, מה שמוביל לשיפור הביצועים והמדדים.

OpenAI שוב תפס את תשומת הלב של קהילת הבינה המלאכותית עם עבודתם פורצת הדרך במודלים של תגמול בפיקוח תהליכים (PRM). גישה חדשנית זו שואפת להעריך את שלבי הביניים וההיגיון של מודלים של AI, מה שמוביל לשיפור הביצועים והמדדים.

OpenAI: מידול חדש של תגמול בפיקוח תהליכים משפר את נימוק הבינה המלאכותית
אשראי: Metaverse Post (mpost.io)
מוּמלָץ: ChatGPT יכול לשנות את וול סטריט על ידי הפיכת המסחר לקל יותר

בחיזוק מסורתי למידה ממשוב אנושי (RLHF), משוב על המודל ניתן בדרך כלל על סמך התוצאה הכוללת שנוצרת על ידי המודל. למרות זאת, OpenAIהמחקר החדש של המחקר בוחן את הרעיון של הערכת השלבים ותהליכי החשיבה האישיים שבוצעו על ידי המודל. על ידי כך, הם יכולים לספק הערכות ומשוב דק יותר.

כדי להתמודד עם בעיה זו, OpenAI בעיות מתמטיות נבחרות שדרשו מספר פעולות. נפרד מודל הוכשר להעריך ביעילות את שלבי הביניים, ולפעול כמבקר כדי לזהות כל שיפוט שגוי שנעשה על ידי המודל העיקרי. תהליך זה לא רק משפר את הביצועים הכוללים אלא גם משפר את המדדים המשמשים להערכת יכולות המודל.

OpenAI עשתה צעדים משמעותיים בתחום זה, עם שחרורו של מערך נתונים שנערך בקפידה המורכב ממנו 800,000 פסקי דין מסומנים. כל פסק דין מייצג שלב נפרד בפתרון בעיות מתמטיות והוא נוצר באופן ידני. זה מדגיש את רמת המסירות והמשאבים OpenAI משקיעה בפיתוח מערכי נתונים באיכות גבוהה, מעלה שאלות לגבי נפח הנתונים שנאספים עבור תחומים אחרים כגון תכנות או שאלות פתוחות.

האימון של GPT-4, OpenAIהאיטרציה האחרונה של ה GPT סדרה, כבר בעיצומו. בעוד שרכיב RLHF אינו משולב בניסויים הנוכחיים, נעשה שימוש במודל שפה טהור. במיוחד, OpenAI מזכיר שישנן מספר גרסאות של GPT-4, כאשר אפילו הגרסה הקטנה ביותר דורשת פחות משאבים משמעותית לאימון - בערך פי 200 פחות.

דוגמה מסקרנת משותפת על ידי OpenAI מציג כיצד המודל מעריך כל שלב החלטה אינדיבידואלי. בצילום מסך שנכלל בפוסט, שגיאות בפתרון מסומנות ומקבלות את ציון הנכונות הנמוך ביותר, מסומנות באדום.
אשראי: OpenAI

דוגמה מסקרנת משותפת על ידי OpenAI מציג כיצד המודל מעריך כל שלב החלטה אינדיבידואלי. בצילום מסך שנכלל בפוסט, שגיאות בפתרון מסומנות ומקבלות את ציון הנכונות הנמוך ביותר, מסומנות באדום. הדגמה זו מדגישה את יכולתו של המודל לנמק ומספקת תובנות חשובות לגבי תהליך קבלת ההחלטות שלו. OpenAI סיפקה גם הוראות לסימון, ומציעה הזדמנויות למקורות המונים לתרום ולהפיק תועלת מעבודתם.

As OpenAI ממשיכים לדחוף את הגבולות של מחקר בינה מלאכותית, ההתמקדות שלהם בהנמקת מודלים ומידול תגמול בפיקוח תהליך מביאה אפשרויות חדשות ליכולות AI משופרות. פריצת הדרך האחרונה הזו מציגה את המחויבות שלהם לשיפור ביצועי הדגם ופותחת דלתות להתקדמות נוספת בתחום.

קרא עוד על AI:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
המעבר של דונלד טראמפ לקריפטו: מיריב לעורך דין, ומה זה אומר על שוק המטבעות הקריפטוגרפיים בארה"ב
עסקים שוקי סיפורים וסקירות טכנולוגיה
המעבר של דונלד טראמפ לקריפטו: מיריב לעורך דין, ומה זה אומר על שוק המטבעות הקריפטוגרפיים בארה"ב
מאי 10, 2024
Layer3 להשיק אסימון L3 בקיץ הקרוב, תוך הקצאת 51% מסך האספקה ​​לקהילה
שוקי דיווח חדשות טכנולוגיה
Layer3 להשיק אסימון L3 בקיץ הקרוב, תוך הקצאת 51% מסך האספקה ​​לקהילה
מאי 10, 2024
האזהרה האחרונה של אדוארד סנודן למפתחי ביטקוין: "הפוך את הפרטיות לעדיפות ברמת הפרוטוקול או הסיכון לאבד אותה
שוקי אבטחה Wiki תוכנה סיפורים וסקירות טכנולוגיה
האזהרה האחרונה של אדוארד סנודן למפתחי ביטקוין: "הפוך את הפרטיות לעדיפות ברמת הפרוטוקול או הסיכון לאבד אותה
מאי 10, 2024
רשת Ethereum Layer 2 מונעת אופטימיות תשיק את הרשת המרכזית שלה ב-15 במאי
דיווח חדשות טכנולוגיה
רשת Ethereum Layer 2 מונעת אופטימיות תשיק את הרשת המרכזית שלה ב-15 במאי
מאי 10, 2024
CRYPTOMERIA LABS PTE. בע"מ.