GPT-4 ביצועים טובים יותר מהאדם הממוצע במבחן של הנמקה לוגית, מחקר טענות
בקיצור
איליה פסטוב, חוקר בינה מלאכותית רוסי, יצר את מבחן החשיבה הלוגית, אותו עברו 12 אלף איש.
לאחרונה הוא השיג גישה לחכם יותר GPT-4, וערכו ניסוי כדי לראות אם השאילתה הנכונה יכולה להניב תוצאות מסוימות.
התוצאות הראו כי GPT-4 עלה על האדם הממוצע בהיגיון הגיוני.
איליה פסטוב, חוקר AI רוסי ידוע, פרסם הודעה על שלו ערוץ המברקים על כמה טוב הרשת העצבית מתמודדת עם בדיקות לוגיות. איליה יצר פעם את @psylogicbot מבחן חשיבה לוגית, אשר נלקח על ידי כ-12 אלף איש. אתה יכול לבדוק את הנתונים הסטטיסטיים לאחר ביצוע המבחן.
הוא כתב את זה ChatGPT גם נבדק, אבל התוצאות השאירו הרבה לרצוי. לאחרונה הוא קיבל גישה לגרסה החכמה והמעודכנת יותר של GPT דֶגֶם-GPT-4— והחליט לבדוק אם זה יקבל תוצאות דומות.
הניסוי נערך באופן הבא: החוקר יצר טקסט שתיאר את המשימה שהרשת העצבית צריכה להשלים. החוקר פרסם הכל בתגובות: הנחיה הייתה: "אני אתן לך חידת היגיון וארבע תשובות אפשריות; בחר את התשובה הנכונה אחת מהם." לאחר מכן, עבור כל שאלת מבחן, איליה יצר דו-שיח חדש ושלח את GPT-4 תיאור יחד עם טקסט השאלה. הבוט קיבל את התגובה ללא כל תיקונים או רמזים.
ישנן 25 שאלות בסך הכל, עם נקודה אחת לכל תשובה נכונה. לפי הסטטיסטיקה, המשתמשים קולעים 13.6 נקודות בממוצע, עם חציון של לא יותר מ-14. כמה עשו GPT-4 לקבל? זה הצליח להשיג 16 נקודות!
שוב, הרשת העצבית עולה על האדם הממוצע בהיגיון הגיוני. כלומר, הוא עולה על רוב האנשים שנבדקו. וזה לאחר שלוקחים בחשבון:
- המבחן נערך ברוסית, בעוד שהדגם מכוון לאנגלית;
- GPT-4, המשמש בצ'אט, פחות אינטליגנטי מקודמו (תופעת לוואי של הגבלות אתיות).
בנפרד, נפרסם תשובה מצוינת לשאלה 22, שבה הנוירון השתמש בלוגיקה מסדר ראשון כדי לגזור את התוצאה באופן מתמטי. אמנם זה היה מכוסה במתמטיקה שימושית, אבל זה לא קורס באוניברסיטה שכולם לוקחים.
עדיין מאמין בזה רשתות עצביות הם אופנה? ראשית, נסה להשיג ביצועים טובים יותר GPT-4 (ושתף את התוצאות שלך בתגובות).
קרא עוד על AI:
כתב ויתור
בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.
על המחבר
דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט.
מאמרים נוספיםדמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט.