דיווח חדשות טכנולוגיה
במרץ 29, 2023

GPT-4 ביצועים טובים יותר מהאדם הממוצע במבחן של הנמקה לוגית, מחקר טענות

בקיצור

איליה פסטוב, חוקר בינה מלאכותית רוסי, יצר את מבחן החשיבה הלוגית, אותו עברו 12 אלף איש.

לאחרונה הוא השיג גישה לחכם יותר GPT-4, וערכו ניסוי כדי לראות אם השאילתה הנכונה יכולה להניב תוצאות מסוימות.

התוצאות הראו כי GPT-4 עלה על האדם הממוצע בהיגיון הגיוני.

איליה פסטוב, חוקר AI רוסי ידוע, פרסם הודעה על שלו ערוץ המברקים על כמה טוב הרשת העצבית מתמודדת עם בדיקות לוגיות. איליה יצר פעם את @psylogicbot מבחן חשיבה לוגית, אשר נלקח על ידי כ-12 אלף איש. אתה יכול לבדוק את הנתונים הסטטיסטיים לאחר ביצוע המבחן.

@Midjourney / Abdalla(hamoXX)#7378
קרא עוד: 20+ טלגרם AI Chatbots הטובים ביותר של 2023

הוא כתב את זה ChatGPT גם נבדק, אבל התוצאות השאירו הרבה לרצוי. לאחרונה הוא קיבל גישה לגרסה החכמה והמעודכנת יותר של GPT דֶגֶם-GPT-4— והחליט לבדוק אם זה יקבל תוצאות דומות.

הניסוי נערך באופן הבא: החוקר יצר טקסט שתיאר את המשימה שהרשת העצבית צריכה להשלים. החוקר פרסם הכל בתגובות: הנחיה הייתה: "אני אתן לך חידת היגיון וארבע תשובות אפשריות; בחר את התשובה הנכונה אחת מהם." לאחר מכן, עבור כל שאלת מבחן, איליה יצר דו-שיח חדש ושלח את GPT-4 תיאור יחד עם טקסט השאלה. הבוט קיבל את התגובה ללא כל תיקונים או רמזים.

ישנן 25 שאלות בסך הכל, עם נקודה אחת לכל תשובה נכונה. לפי הסטטיסטיקה, המשתמשים קולעים 13.6 נקודות בממוצע, עם חציון של לא יותר מ-14. כמה עשו GPT-4 לקבל? זה הצליח להשיג 16 נקודות!

שוב, הרשת העצבית עולה על האדם הממוצע בהיגיון הגיוני. כלומר, הוא עולה על רוב האנשים שנבדקו. וזה לאחר שלוקחים בחשבון:

  • המבחן נערך ברוסית, בעוד שהדגם מכוון לאנגלית;
  • GPT-4, המשמש בצ'אט, פחות אינטליגנטי מקודמו (תופעת לוואי של הגבלות אתיות).

בנפרד, נפרסם תשובה מצוינת לשאלה 22, שבה הנוירון השתמש בלוגיקה מסדר ראשון כדי לגזור את התוצאה באופן מתמטי. אמנם זה היה מכוסה במתמטיקה שימושית, אבל זה לא קורס באוניברסיטה שכולם לוקחים.

בנפרד, נפרסם תשובה מצוינת לשאלה 22 שבה הנוירון השתמש בלוגיקה מסדר ראשון כדי לגזור את התוצאה באופן מתמטי. כולנו ידענו לעשות את זה גם במתמטיקה שימושית, אבל זה היה קורס נוסף באוניברסיטה.

עדיין מאמין בזה רשתות עצביות הם אופנה? ראשית, נסה להשיג ביצועים טובים יותר GPT-4 (ושתף את התוצאות שלך בתגובות).

קרא עוד על AI:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
המעבר של דונלד טראמפ לקריפטו: מיריב לעורך דין, ומה זה אומר על שוק המטבעות הקריפטוגרפיים בארה"ב
עסקים שוקי סיפורים וסקירות טכנולוגיה
המעבר של דונלד טראמפ לקריפטו: מיריב לעורך דין, ומה זה אומר על שוק המטבעות הקריפטוגרפיים בארה"ב
מאי 10, 2024
Layer3 להשיק אסימון L3 בקיץ הקרוב, תוך הקצאת 51% מסך האספקה ​​לקהילה
שוקי דיווח חדשות טכנולוגיה
Layer3 להשיק אסימון L3 בקיץ הקרוב, תוך הקצאת 51% מסך האספקה ​​לקהילה
מאי 10, 2024
האזהרה האחרונה של אדוארד סנודן למפתחי ביטקוין: "הפוך את הפרטיות לעדיפות ברמת הפרוטוקול או הסיכון לאבד אותה
שוקי אבטחה Wiki תוכנה סיפורים וסקירות טכנולוגיה
האזהרה האחרונה של אדוארד סנודן למפתחי ביטקוין: "הפוך את הפרטיות לעדיפות ברמת הפרוטוקול או הסיכון לאבד אותה
מאי 10, 2024
רשת Ethereum Layer 2 מונעת אופטימיות תשיק את הרשת המרכזית שלה ב-15 במאי
דיווח חדשות טכנולוגיה
רשת Ethereum Layer 2 מונעת אופטימיות תשיק את הרשת המרכזית שלה ב-15 במאי
מאי 10, 2024
CRYPTOMERIA LABS PTE. בע"מ.