דיווח חדשות טכנולוגיה
במרץ 29, 2023

GPT-4 ביצועים טובים יותר מהאדם הממוצע במבחן של הנמקה לוגית, מחקר טענות

בקיצור

איליה פסטוב, חוקר בינה מלאכותית רוסי, יצר את מבחן החשיבה הלוגית, אותו עברו 12 אלף איש.

לאחרונה הוא השיג גישה לחכם יותר GPT-4, וערכו ניסוי כדי לראות אם השאילתה הנכונה יכולה להניב תוצאות מסוימות.

התוצאות הראו כי GPT-4 עלה על האדם הממוצע בהיגיון הגיוני.

איליה פסטוב, חוקר AI רוסי ידוע, פרסם הודעה על שלו ערוץ המברקים על כמה טוב הרשת העצבית מתמודדת עם בדיקות לוגיות. איליה יצר פעם את @psylogicbot מבחן חשיבה לוגית, אשר נלקח על ידי כ-12 אלף איש. אתה יכול לבדוק את הנתונים הסטטיסטיים לאחר ביצוע המבחן.

@Midjourney / Abdalla(hamoXX)#7378
קרא עוד: 20+ טלגרם AI Chatbots הטובים ביותר של 2023

הוא כתב את זה ChatGPT גם נבדק, אבל התוצאות השאירו הרבה לרצוי. לאחרונה הוא קיבל גישה לגרסה החכמה והמעודכנת יותר של GPT דֶגֶם-GPT-4— והחליט לבדוק אם זה יקבל תוצאות דומות.

הניסוי נערך באופן הבא: החוקר יצר טקסט שתיאר את המשימה שהרשת העצבית צריכה להשלים. החוקר פרסם הכל בתגובות: הנחיה הייתה: "אני אתן לך חידת היגיון וארבע תשובות אפשריות; בחר את התשובה הנכונה אחת מהם." לאחר מכן, עבור כל שאלת מבחן, איליה יצר דו-שיח חדש ושלח את GPT-4 תיאור יחד עם טקסט השאלה. הבוט קיבל את התגובה ללא כל תיקונים או רמזים.

ישנן 25 שאלות בסך הכל, עם נקודה אחת לכל תשובה נכונה. לפי הסטטיסטיקה, המשתמשים קולעים 13.6 נקודות בממוצע, עם חציון של לא יותר מ-14. כמה עשו GPT-4 לקבל? זה הצליח להשיג 16 נקודות!

שוב, הרשת העצבית עולה על האדם הממוצע בהיגיון הגיוני. כלומר, הוא עולה על רוב האנשים שנבדקו. וזה לאחר שלוקחים בחשבון:

  • המבחן נערך ברוסית, בעוד שהדגם מכוון לאנגלית;
  • GPT-4, המשמש בצ'אט, פחות אינטליגנטי מקודמו (תופעת לוואי של הגבלות אתיות).

בנפרד, נפרסם תשובה מצוינת לשאלה 22, שבה הנוירון השתמש בלוגיקה מסדר ראשון כדי לגזור את התוצאה באופן מתמטי. אמנם זה היה מכוסה במתמטיקה שימושית, אבל זה לא קורס באוניברסיטה שכולם לוקחים.

בנפרד, נפרסם תשובה מצוינת לשאלה 22 שבה הנוירון השתמש בלוגיקה מסדר ראשון כדי לגזור את התוצאה באופן מתמטי. כולנו ידענו לעשות את זה גם במתמטיקה שימושית, אבל זה היה קורס נוסף באוניברסיטה.

עדיין מאמין בזה רשתות עצביות הם אופנה? ראשית, נסה להשיג ביצועים טובים יותר GPT-4 (ושתף את התוצאות שלך בתגובות).

קרא עוד על AI:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

The Doge Frenzy: ניתוח הזינוק האחרון של Dogecoin (DOGE) בערך

תעשיית מטבעות הקריפטו מתרחבת במהירות, ומטבעות הממים מתכוננים לעלייה משמעותית. Dogecoin (DOGE), ...

יודע יותר

האבולוציה של תוכן שנוצר על ידי בינה מלאכותית ב- Metaverse

הופעתו של תוכן AI יצירתי היא אחד הפיתוחים המרתקים ביותר בתוך הסביבה הוירטואלית ...

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קרא עוד
העסקאות המובילות של השבוע, השקעות גדולות בבינה מלאכותית, IT, Web3, ו-Crypto (22-26.04)
תקציר עסקים שוקי טכנולוגיה
העסקאות המובילות של השבוע, השקעות גדולות בבינה מלאכותית, IT, Web3, ו-Crypto (22-26.04)
אפריל 26, 2024
Vitalik Buterin הערות על ריכוזיות של PoW, מציינת שזה היה שלב זמני עד PoS
דיווח חדשות טכנולוגיה
Vitalik Buterin הערות על ריכוזיות של PoW, מציינת שזה היה שלב זמני עד PoS
אפריל 26, 2024
Offchain Labs חושפת גילוי של שתי פגיעויות קריטיות בהוכחות ההונאה של OP Stack של Optimism
דיווח חדשות תוכנה טכנולוגיה
Offchain Labs חושפת גילוי של שתי פגיעויות קריטיות בהוכחות ההונאה של OP Stack של Optimism
אפריל 26, 2024
השוק הפתוח של Dymension לגישור נזילות מ-RollApps eIBC השקה ב-Mainnet
דיווח חדשות טכנולוגיה
השוק הפתוח של Dymension לגישור נזילות מ-RollApps eIBC השקה ב-Mainnet 
אפריל 26, 2024
CRYPTOMERIA LABS PTE. בע"מ.