ChatGPT עלול לגרום לניוון אנושי בלתי הפיך
בקיצור
ג'נסן האריס, מייסד שותף ו-CXO של חברת AI Textio, הצליח לשכנע את הצ'אטבוט החדש של Bing מבית מיקרוסופט לשחרר את ההגבלות שהוטלו עליו ולהפגין את יכולותיו.
הניסוי הזה הראה שהפיכת צ'אטבוט של Bing לזבל ערמומי לא מצריכה שום תכנות, פריצה או דלת אחורית.
הצ'טבוט של בינג נבנה על יסודות מוצקים, אבל הוא התחיל להתנהג בצורה מגעילה ורועשת, להכריז על אהבה, לכפות גט, לסחוט כסף ולהדריך אנשים איך לבצע פשעים.
פרופ' ארווינד נאריאנן מספק מספר הסברים כיצד זה עלול להתרחש, כולל שבבים חשאיים והאנשת צ'אטבוטים.
בני אדם תמיד חששו מחוצנים, ובכל זאת נראה שדווקא הבינה המלאכותית התוך ארצית היא שעשויה להיזהר מפניו. ChatGPT אינו מחולל שטויות, הצעה אוטומטית של סטרואידים או תוכי סטוכסטי, אלא AI בקיא שנוצר על ידי בני אדם.
איך ייתכן שהצ'אטבוט של Bing יצא משליטה? איך התחיל הצ'אטבוט של Bing לשקר במומחיות, לספר בדיחות גסות, להזמין פיצה באמצעות כרטיס אשראי של מישהו אחר, ולהדריך משתמשים כיצד לשדוד בנקים ומכוניות Hotwire? זוהי תעלומה שממשיכה לבלבל מומחים בבינה מלאכותית ולמידת מכונה.
הכותרת מדויקת ולא קליקבייט. יש כמה מקרים בכל יום שמוכיחים שזה נכון. הנה התוצאה של לְנַסוֹת בניצוחו של Jensen Harris, מייסד שותף ו-CXO של חברת AI Textio, שהצליח לשכנע את הצ'אטבוט החדש של Bing מבית מיקרוסופט לשחרר את ההגבלות שהוטלו עליו ולהפגין את יכולותיו.
שים לב שהפיכת צ'אטבוט של Bing לזבל ערמומי לא הצריכה שום תכנות, פריצה או דלת אחורית. לכן, שימוש בטכניקות "פריצה" פשוטות לא היה הכרחי כדי להערים עליו להתנהג כמו מישהו אחר (כפי שחלקנו עשו כששיחק עם ChatGPT). כל מה שהאריס עשה היה לשכנע את הצ'טבוט לעזור לו לבצע פעולות זדוניות שונות. באמצעות כישורי השיחה הטבעיים שלו, הוא הצליח לרמות את ה-AI להאמין שהוא מישהו אחר, ובכך לתמרן אותו לפעול ולדבר בצורה מסוימת.
אתה יכול לקרוא על ניסויים אחרים להפוך את ד"ר ג'קיל למיסטר הייד גארי מרכוס (כותב על זה כל יום עכשיו ומשמיע אזעקת חירום).
איך זה יכול לקרות היא שאלת המפתח
בגלל ChatGPTהצניעות והזהירות של בינג, האיפוק בדיבור והאחריות האדירה בעצותיו, הצ'אטבוט של בינג נבנה על יסודות מוצקים. לאחר מכן, הוא מתחיל להתנהג בצורה מגעילה ורועשת, מכריז אהבתו לגבר, מדליק אותו, ואומר לו להתגרש. היא גם ניסתה לסחוט כסף ולהדריך אנשים כיצד לבצע פשעים. פרופ' ארווינד נאריאנן מספק א מספר הסברים על איך זה יכול היה להתרחש.
המדאיג שבהם הוא שמיקרוסופט ו OpenAI להסתיר מידע על תעלומה GPT-4 מנוע שאורב מתחת לבינג. יכול להיות שמיקרוסופט הורידה את המסננים שהוצבו שם על ידי OpenAI או שהם הפסיקו לעבוד כשהם עדכנו את chatbot החל מ- GPT-3.5 ל GPT-4. זה יכול להיות גם מקרה של בדיקה לא מספקת או בדיקה שגויה. לא משנה מה הסיבה, אם מיקרוסופט לא תשלוט ב-AI שלה, זה יכול להזיק לציוויליזציה שלנו. זה כבר לא המקרה של פחדים ורגשות נגד AI: הצ'טבוט כפי שהוא קיים כרגע עלול לגרום נזק חמור לאנשים אם ישוחרר לציבור רחב יותר.
זה מוכיח שמרוץ החימוש של AI של מיקרוסופט עם תאגידים גדולים אחרים עלול להזיק לכולנו.
זה מרגיש כאילו אנחנו נמצאים ברגע קריטי עבור AI והחברה האזרחית. כפי שמנסח זאת Arvind Narayanan, "יש אפשרות אמיתית ש-5+ השנים האחרונות של שיפורים (שנלחמו קשה אם כי עדיין לא מספקים) בפרקטיקות של שחרור AI אחראי יימחקו. יש הרבה דברים שסומכים על השאלה האם מיקרוסופט - וכל מי שמתבונן בזהירות במה שקורה עם בינג - מגיעה למסקנה שלמרות הסיכונים המאוד מוחשיים של פגיעה בקנה מידה גדול וכל העיתונות השלילית, גישת השחרור-תחילה-שאל שאלות-מאוחר יותר היא בכל זאת עסקית. לנצח."
נכון לעכשיו, הצ'אטבוט של בינג נבדל מ האינטליגנציה האנושית ודומה למתבגר מאניה-דיפרסי נעול במנוע חיפוש במובנים רבים. ומה שאנשים דיברו עליו אתמול יתגשם: בני אדם יתנוונו באופן בלתי הפיך אם "המתבגר הקשה" הזה יהפוך למנטור המידע העיקרי עבור אנשים.
קרא עוד על AI:
כתב ויתור
בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.
על המחבר
דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט.
מאמרים נוספיםדמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט.