דיווח חדשות טכנולוגיה
אוקטובר 12, 2023

דגמי השפה הגדולים של היום יהיו מודלים קטנים, לדברי חוקר ב OpenAI

Hyung Won Chung, חוקר בינה מלאכותית מוכשרת אשר הועסק בעבר ב-Google Brain וכיום חבר ב- OpenAI צוות, נשא נאום מעורר מחשבה בן 45 דקות בו חקר את עולם המודלים של שפות גדולות בשנת 2023. לצ'ונג יש ניסיון בתחום; הוא היה המחבר הראשון של מאמר גוגל "שינוי קנה מידה של מודלים של שפה מכוונים להוראות,” שבודק כיצד ניתן לאמן מודלים של שפה גדולים לעקוב אחר הוראות.

היונג וון צ'ונג, OpenAI

צ'ונג מדגיש את עולם המודלים הנרחבים של שפה דינמית. בעולם של LLMs, העיקרון המנחה מתפתח כל הזמן, בניגוד לתחומים מסורתיים שבהם הנחות יסוד בדרך כלל נשארות יציבות. עם הדור הקרוב של הדגמים, מה שנחשב כרגע בלתי אפשרי או בלתי מעשי עשוי להפוך לאפשרי. הוא מדגיש את המשמעות של הקדמת רוב הטענות לגבי יכולות LLM עם "בינתיים". מודל יכול לבצע משימה; זה פשוט לא עשה זאת עדיין.

דגמים גדולים של היום יהיו דגמים קטנים רק בעוד כמה שנים

היונג וון צ'ונג, OpenAI

הצורך בתיעוד קפדני ובשעתוק ב מחקר בינה מלאכותית הוא אחד הלקחים החשובים ביותר שניתן ללמוד מנאומו של צ'ונג. זה חיוני לתעד ביסודיות עבודה שוטפת עם התפתחות התחום. אסטרטגיה זו מבטיחה שניתן לשכפל ניסויים במהירות ולעיין בהם מחדש, מה שמאפשר לחוקרים להתבסס על עבודה קודמת. באמצעות תרגול זה, יש הכרה בכך שעשויות להתפתח בעתיד יכולות שלא היו מעשיות במהלך המחקר הראשוני.

צ'ונג מקדיש חלק מדבריו להבהרת המורכבות של נתונים ומקביליות מודלים. עבור אלה המעוניינים להעמיק בהיבטים הטכניים של AI, חלק זה מספק תובנות חשובות לגבי פעולתן הפנימית של טכניקות מקביליות אלו. הבנת המנגנונים הללו חיונית לאופטימיזציה הכשרת מודלים בקנה מידה גדול.

צ'ונג טוען שהפונקציה האובייקטיבית הנוכחית, Maximum Likelihood, המשמשת לאימון מקדים LLM היא צוואר בקבוק בכל הנוגע להשגת קנה מידה מסיבי באמת, כמו פי 10,000 מהקיבולת של GPT-4. ככל שלמידת מכונה מתקדמת, פונקציות אובדן שתוכננו באופן ידני הופכות למגבילות יותר ויותר.

צ'ונג מציע שהפרדיגמה הבאה בפיתוח בינה מלאכותית כוללת למידה של פונקציות באמצעות אלגוריתמים נפרדים. גישה זו, אם כי בחיתוליה, טומנת בחובה הבטחה להרחבה מעבר לאילוצים הנוכחיים. הוא גם מדגיש מאמצים מתמשכים, כגון למידה של חיזוק משוב אנושי (RLHF) עם מודלים של כללים, כצעדים בכיוון זה, אם כי עדיין יש להתגבר על אתגרים.

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
המעבר של דונלד טראמפ לקריפטו: מיריב לעורך דין, ומה זה אומר על שוק המטבעות הקריפטוגרפיים בארה"ב
עסקים שוקי סיפורים וסקירות טכנולוגיה
המעבר של דונלד טראמפ לקריפטו: מיריב לעורך דין, ומה זה אומר על שוק המטבעות הקריפטוגרפיים בארה"ב
מאי 10, 2024
Layer3 להשיק אסימון L3 בקיץ הקרוב, תוך הקצאת 51% מסך האספקה ​​לקהילה
שוקי דיווח חדשות טכנולוגיה
Layer3 להשיק אסימון L3 בקיץ הקרוב, תוך הקצאת 51% מסך האספקה ​​לקהילה
מאי 10, 2024
האזהרה האחרונה של אדוארד סנודן למפתחי ביטקוין: "הפוך את הפרטיות לעדיפות ברמת הפרוטוקול או הסיכון לאבד אותה
שוקי אבטחה Wiki תוכנה סיפורים וסקירות טכנולוגיה
האזהרה האחרונה של אדוארד סנודן למפתחי ביטקוין: "הפוך את הפרטיות לעדיפות ברמת הפרוטוקול או הסיכון לאבד אותה
מאי 10, 2024
רשת Ethereum Layer 2 מונעת אופטימיות תשיק את הרשת המרכזית שלה ב-15 במאי
דיווח חדשות טכנולוגיה
רשת Ethereum Layer 2 מונעת אופטימיות תשיק את הרשת המרכזית שלה ב-15 במאי
מאי 10, 2024
CRYPTOMERIA LABS PTE. בע"מ.