דיווח חדשות טכנולוגיה
במרץ 15, 2023

GPT-4 יכול לטפל בבקשות שלך לתמונות, מסמכים, דיאגרמות וצילומי מסך

בקיצור

GPT-4 יכול לטפל בבקשות לתמונות, מסמכים, דיאגרמות וצילומי מסך. זה שיפור לעומת GPT-3, שטיפל רק בטקסט.

GPT-4 בעל ביצועים מעולים בבחינות ומבחנים שונים ויכול לגשת למידע ופרטים נוספים דרך תמונות שאולי לא יהיו זמינות בכתב.

gpt-4 תמונות מסמכים צילומי מסך

OpenAIאבן הדרך האחרונה של הדגם החדש GPT-4, יכול לקבל בקשות הכוללות תמונות, מסמכים עם טקסט, דיאגרמות או צילומי מסך כקלט. זה מייצג שיפור משמעותי לעומת הגרסה הקודמת, GPT-3, שיכול היה להבין ולהוציא רק טקסט. עם תכונה חדשה זו, GPT-4 יוצר פלטי טקסט בהינתן קלט המורכב מטקסט ותמונות משובצים.

"על פני מגוון תחומים - כולל מסמכים עם טקסט ותצלומים, דיאגרמות או צילומי מסך -GPT-4 מציג יכולות דומות כפי שהוא מציג בקלט טקסט בלבד",

OpenAI כתבתי.

ChatGPT-4 בעל גודל גדול יותר מקודמיו, מה שמעיד על כך שהוא עבר הכשרה על כמות גדולה יותר של נתונים ומכיל יותר משקלים בקובץ המודל שלו, מה שמביא לעלות גבוהה יותר לתפעול שלו. שפת הבינה המלאכותית החדשה ביותר יכולה ליצור טקסט דמוי אדם על ידי שימוש למידה עמוקה והכשרה מוקדמת על מערך נתונים גדול.

GPT-4 יש ל הפגין ביצועים מעולים על פני שפות AI אחרות במגוון מבחנים ומבחנים בין היתר בשל יכולתו לגשת למידע ופרטים נוספים באמצעות תמונות שאולי לא יהיו זמינות בצורה כתובה.

DELETE THIS GPT-4 המודל יכול לומר לך מה בדיוק מתואר באיור, לנתח אותו ואפילו להסביר את משמעותו. בהדגמה, GPT-4 הסביר את הבדיחה החזותית שבה מחובר כבל VGA לאייפון. זה יכול גם להסביר מה יוצא דופן בתמונה המציגה "גיהוץ קיצוני", שתוכל לבדוק למטה.

gpt-4 תמונות
מקור: OpenAI

עם זאת, יש גם השלכות שימושיות יותר GPT-4הידע החדש של החברה. במצגת הוצג כי PGT-4 יכול לדעת מה ניתן לבשל מהמרכיבים המוצגים בתמונה. זה אומר שהדגם יכול לעזור לך לבשל אם יש לך מוצרי מזון ואין לך מושג מה לעשות איתם. צלם תמונת מצב של האוכל שיש לך, ושוחח-GPT יכול להגיד לך מה אתה יכול להכין מהמרכיבים שיש לך בבית.

היכולת הזו להבין ולפרש מידע חזותי עושה GPT-4 כלי רב עוצמה למשימות כמו כיתוב תמונה, מענה על שאלות חזותיות ואפילו יצירת תוכן. עם שילוב של טקסט והבנה חזותית כאחד, GPT-4 יש פוטנציאל לחולל מהפכה בתעשיות שונות, כגון פרסום, עיצוב ומסחר אלקטרוני, ולעזור לאנשים לבצע עבורם את המשימות המשעממות והשגרתיות.

המתקדם מודל שפה גם 'מבין' צילומי מסך ומסמכים עם טקסט, טבלאות, דיאגרמות או ייצוגים חזותיים אחרים. לדוגמה, אם אתה מעלה עבודת מחקר בת שלושה עמודים ואתה זקוק לסיכום והסבר, GPT-4 מסוגל לעשות זאת. 

העוגן של בלומברג, ג'ון ארליכמן, הדגים כיצד הוא הצליח להפוך עיצוב משורטט ביד לאתר פונקציונלי.

הטכנולוגיה החדשה יכולה לשמש גם כעזר לניידות מכיוון שהיא יכולה לשמש לתיאור הסביבה עבור אנשים לקויי ראייה. לשם כך, Open AI כבר שיתפה פעולה עם אפליקציה בשם היה העיניים שלי אשר תוכנן לתת לעיוורים יד לעזור כאשר הם צריכים להסתכל על משהו, למשל, בזמן קניות מכולת. האפליקציה מאפשרת "למתנדבים ואנשי מקצוע בעלי ראיה לתת את עיניהם לפתור משימות קטנות וגדולות כדי לסייע לאנשים עיוורים ובעלי ראייה ירודה לנהל חיים עצמאיים יותר". כעת, הוא מציע גם כלי וירטואלי להתנדבות המופעל על ידי OpenAI"S GPT-4.

למרות OpenAI"S GPT-4 מציע כרגע את היכולת לעבד טקסט ותמונות כקלט, הדגם עדיין לא מצויד לטיפול בכניסות אודיו ווידאו. עם זאת, ישנם אינדיקציות לכך ששיטות אלה עשויות להיכלל באיטרציה הבאה של הטכנולוגיה.

קרא עוד:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

אגנה היא עיתונאית שמסקרת את המגמות וההתפתחויות האחרונות ב-metaverse, AI, ו Web3 תעשיות עבור Metaverse Post. התשוקה שלה לספר סיפורים הובילה אותה לערוך ראיונות רבים עם מומחים בתחומים אלה, כשהם מחפשים תמיד לחשוף סיפורים מרגשים ומרתקים. אגנה היא בעלת תואר ראשון בספרות ובעלת רקע נרחב בכתיבה על מגוון רחב של נושאים לרבות נסיעות, אמנות ותרבות. היא גם התנדבה כעורכת בארגון לזכויות בעלי חיים, שם סייעה להעלות את המודעות לנושאים של רווחת בעלי חיים. צור איתה קשר [מוגן בדוא"ל].

מאמרים נוספים
אגנה צימרמן
אגנה צימרמן

אגנה היא עיתונאית שמסקרת את המגמות וההתפתחויות האחרונות ב-metaverse, AI, ו Web3 תעשיות עבור Metaverse Post. התשוקה שלה לספר סיפורים הובילה אותה לערוך ראיונות רבים עם מומחים בתחומים אלה, כשהם מחפשים תמיד לחשוף סיפורים מרגשים ומרתקים. אגנה היא בעלת תואר ראשון בספרות ובעלת רקע נרחב בכתיבה על מגוון רחב של נושאים לרבות נסיעות, אמנות ותרבות. היא גם התנדבה כעורכת בארגון לזכויות בעלי חיים, שם סייעה להעלות את המודעות לנושאים של רווחת בעלי חיים. צור איתה קשר [מוגן בדוא"ל].

Hot Stories

BRICS Nations Eye Stablecoin פתרון סחר

by ויקטוריה פלצ'יק
מאי 01, 2024
הצטרף לניוזלטר שלנו.
חדשות אחרונות

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר

מייסדי ארנק סמוראי הואשמו בהנחיית 2 מיליארד דולר בעסקאות Darknet

החשש של מייסדי ארנק סמוראי מייצג כישלון בולט עבור התעשייה, המדגיש את ...

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קרא עוד
Ankr משתפת פעולה עם AI Blockchain Platform Talus Network כדי לפתוח את נזילות הביטקוין עבור AI
עסקים דיווח חדשות טכנולוגיה
Ankr משתפת פעולה עם AI Blockchain Platform Talus Network כדי לפתוח את נזילות הביטקוין עבור AI
מאי 1, 2024
Binance Labs תומכת במעבדות תנועה כדי להקל על שילוב המהלך של פייסבוק על פני בלוקצ'יין
עסקים דיווח חדשות טכנולוגיה
Binance Labs תומכת במעבדות תנועה כדי להקל על שילוב המהלך של פייסבוק על פני בלוקצ'יין
מאי 1, 2024
BRICS Nations Eye Stablecoin פתרון סחר
עסקים שוקי סיפורים וסקירות טכנולוגיה
BRICS Nations Eye Stablecoin פתרון סחר
מאי 1, 2024
Bitcoin L2 Network BOB משתלב עם LayerZero לפונקציונליות משופרת
עסקים דיווח חדשות טכנולוגיה
Bitcoin L2 Network BOB משתלב עם LayerZero לפונקציונליות משופרת
מאי 1, 2024
CRYPTOMERIA LABS PTE. בע"מ.