דיווח חדשות טכנולוגיה
יוני 21, 2023

חוקרים מגלים דרך חדשה לזהות טקסט שנוצר בינה מלאכותית

בקיצור

חוקרים פיתחו שיטה לזיהוי טקסט שנוצר בינה מלאכותית באמצעות מודל ה-RoBERTa, המחלץ הטמעות של אסימוני טקסט ומדמיינת אותם כנקודות במרחב רב-ממדי.

הם גילו את הטקסט שנוצר על ידי GPT-3.5 דגמים, כגון ChatGPT ו-Davinci, היו בעלי ממדים ממוצעים נמוכים משמעותית מטקסט שנכתב על ידי אדם.

החוקרים יצרו גלאי חזק מבוסס מימדים שהיה עמיד לטכניקות התחמקות נפוצות.

הדיוק של הגלאי נשאר גבוה באופן עקבי כאשר תחומים ודגמים שונו, עם סף קבוע וירידה של 40% דיוק כאשר מאותגר בטכניקת DIPPER.

חוקרים חקרו את תחום הטקסט שנוצר בינה מלאכותית ו פיתח שיטה לאיתור תוכן שנוצר על ידי AI דגמים כגון GPT ו Llama. הם גילו תובנות מעניינות לגבי אופיו של טקסט שנוצר על ידי שימוש במושג הממד השברירי. הממצאים שלהם שופכים אור על ההבדלים המובנים בין טקסט שנכתב על ידי בני אדם לבין טקסט שנוצר על ידי מודלים של AI.

חוקרים מגלים דרך חדשה לזהות טקסט שנוצר בינה מלאכותית
אשראי: Metaverse Post (mpost.io)
לקרוא: 100+ המילים המובילות הניתנות לזיהוי על ידי גלאי AI

האם המימד של ענן נקודתי הנגזר מטקסט בשפה טבעית יכול לספק מידע שימושי על מקורו? החוקרים השתמשו במודל RoBERTa כדי לחלץ הטמעות של אסימוני טקסט ולדמיין אותם כנקודות במרחב רב ממדי כדי לחקור זאת. הם העריכו את הממד השברירי של ענני הנקודה הללו באמצעות טכניקות מתוחכמות בהשראת עבודות קודמות.

החוקרים נדהמו לגלות את הטקסט שנוצר על ידי GPT-3.5 דגמים, כגון ChatGPT ו-Davinci, היו בעלי ממדים ממוצעים נמוכים משמעותית מטקסט שנכתב על ידי אדם. הדפוס המסקרן הזה נמשך בכל התחומים ואפילו כאשר מודלים חלופיים כגון GPT-2 או OPT שימשו. יש לציין שגם כאשר משתמשים בפרפרזה DIPPER, שתוכננה במיוחד כדי למנוע זיהוי, הממד השתנה רק בכ-3%. תגליות אלו אפשרו לחוקרים ליצור גלאי חזק מבוסס מימדים העמיד לטכניקות התחמקות נפוצות.

יש לציין שהדיוק של הגלאי נשאר גבוה באופן עקבי כאשר תחומים ודגמים שונו. עם סף קבוע, דיוק הזיהוי (שיעור חיובי אמיתי) נשאר מעל 75% בעוד שיעור חיובי שגוי (FPR) נשאר פחות מ-1%. גם כאשר מערכת הזיהוי אותגרה בטכניקת DIPPER, הדיוק ירד ל-40%, וגברה על הגלאים הקיימים, כולל אלו שפותחו על ידי OpenAI.

יתר על כן, החוקרים בחנו את היישום של מודלים רב לשוניים כמו רוב לשוני RobERTa. זה איפשר להם לפתח גלאים דומים לשפות שאינן אנגלית. בעוד שהמימד הפנימי הממוצע של הטבעות השתנה בין שפות שונות, הממד של טקסטים שנוצרו נשאר נמוך באופן עקבי מזה של טקסט שנכתב על ידי אדם עבור כל שפה ספציפית.

עם זאת, הגלאי הציג כמה חולשות, במיוחד כאשר עמד בפני טמפרטורות דור גבוהות ופרימיטיביות דגמי גנרטורים. בטמפרטורות גבוהות יותר, הממד הפנימי של טקסטים שנוצר עלול לעלות על זה של טקסט שנכתב על ידי אדם, מה שהופך את הגלאי ללא יעיל. למרבה המזל, דגמי גנרטורים כאלה כבר ניתנים לזיהוי באמצעות שיטות חלופיות. בנוסף, החוקרים הכירו שיש מקום לבחון מודלים חלופיים לחילוץ הטמעות טקסט מעבר ל-RoBERTa.

הבחנה בין טקסט אנושי לטקסט שנכתב בבינה מלאכותית

בינואר, OpenAI הודיע השקה של מסווג חדש שנועד להבחין בין טקסט שנכתב על ידי בני אדם לבין טקסט שנוצר על ידי מערכות AI. סיווג זה נועד להתמודד עם האתגרים שמציבים השכיחות הגוברת של תוכן שנוצר בינה מלאכותית, כגון מסעות פרסום שגויים וחוסר יושר אקדמי.

למרות שזיהוי כל הטקסט שנכתב ב-AI הוא משימה מורכבת, מסווג זה משמש ככלי רב ערך להפחתת טענות שווא של מחבר אנושי בטקסט שנוצר בינה מלאכותית. באמצעות הערכות קפדניות על קבוצה של טקסטים באנגלית, מפתחים גילו שמסווג זה מזהה במדויק 26% מהטקסט שנכתב בבינה מלאכותית כ"סביר שנכתב בבינה מלאכותית" (תוצאות חיוביות אמיתיות), ומדי פעם מסמן טקסט שנכתב על ידי אדם כמופק בבינה מלאכותית (שקר) חיוביות) ב-9%. חשוב לציין שהאמינות של המסווג משתפרת ככל שאורך טקסט הקלט עולה. בהשוואה למסווגים קודמים, גרסה חדשה זו מדגימה אמינות גבוהה משמעותית בטקסט שנוצר על ידי מערכות AI עדכניות יותר.

כדי לאסוף משוב בעל ערך על התועלת של כלים לא מושלמים כמו הסיווג הזה, מפתחים עשו זאת זמין לציבור. אתה יכול לנסות את סיווג העבודה שלנו בחינם. עם זאת, חשוב להבין את מגבלותיו. יש להשתמש במסווג ככלי משלים, ולא כמשאב ראשוני לקבלת החלטות, לקביעת מקור הטקסט. זה מפגין חוסר אמינות גבוה בטקסטים קצרים, ויש מקרים שבהם טקסט שנכתב על ידי אדם עשוי להיות מתויג באופן שגוי כ-AI שנוצר.

ראוי לציין שלא ניתן לזהות באופן עקבי טקסטים צפויים ביותר, כגון רשימה של 1,000 המספרים הראשוניים הראשונים. עריכת טקסט שנוצר על ידי בינה מלאכותית יכולה גם לעזור להתחמק מהמסווג, ולמרות שאנו יכולים לעדכן ולאמן מחדש את המסווג בהתבסס על התקפות מוצלחות, היתרון לטווח ארוך של זיהוי נותר לא ברור. יתר על כן, מסווגים מבוססים על רשתות עצביות לרוב מכוילים בצורה גרועה מחוץ לנתוני האימון שלהם, מה שמוביל לביטחון קיצוני בתחזיות שגויות עבור תשומות השונות באופן משמעותי ממערך האימונים.

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
חוק התרומות המתוקן של דרום קוריאה: האם זה צעד קדימה או אחורה עבור פילנתרופיה קריפטו?
האנוסים Wiki תקציר עסקים שוקי טכנולוגיה
חוק התרומות המתוקן של דרום קוריאה: האם זה צעד קדימה או אחורה עבור פילנתרופיה קריפטו?
מאי 8, 2024
בינה מלאכותית גנרית בשנת 2024: מגמות מתעוררות, פריצות דרך ותחזית עתידית
AI Wiki תוכנה סיפורים וסקירות טכנולוגיה
בינה מלאכותית גנרית בשנת 2024: מגמות מתעוררות, פריצות דרך ותחזית עתידית
מאי 8, 2024
DODOchain חושף את השלב הראשון של MACH AVS Mainnet, משיק קמפיין Launchpool עם AltLayer כדי לתמרץ מפעילים עם תגמולים של מערכת אקולוגית
שוקי דיווח חדשות טכנולוגיה
DODOchain חושף את השלב הראשון של MACH AVS Mainnet, משיק קמפיין Launchpool עם AltLayer כדי לתמרץ מפעילים עם תגמולים של מערכת אקולוגית
מאי 8, 2024
zkSync כדי להציג את P256Verify, Bridgehub ו-Valdiums תומכים בתכונות משופרות בשדרוג הבא שלו
דיווח חדשות טכנולוגיה
zkSync כדי להציג את P256Verify, Bridgehub ו-Valdiums תומכים בתכונות משופרות בשדרוג הבא שלו
מאי 8, 2024
CRYPTOMERIA LABS PTE. בע"מ.