تقرير الأخبار تكنولوجيا
15 آذار، 2023

GPT-4 يمكنه التعامل مع طلباتك الخاصة بالصور والمستندات والرسوم البيانية ولقطات الشاشة

في سطور

GPT-4 يمكنه التعامل مع طلبات الصور والمستندات والرسوم البيانية ولقطات الشاشة. إنه تحسن GPT-3، والتي تتعامل مع النص فقط.

GPT-4 يتمتع بأداء متفوق في الامتحانات والاختبارات المختلفة ويمكنه الوصول إلى معلومات وتفاصيل إضافية من خلال الصور التي قد لا تكون متوفرة في شكل مكتوب.

gpt-4 الصور الوثائق لقطات الشاشة

OpenAIأحدث معلم ، النموذج الجديد GPT-4، يمكنه قبول الطلبات التي تتضمن صورًا أو مستندات تحتوي على نص أو رسوم بيانية أو لقطات شاشة كمدخلات. ويمثل هذا تحسنا كبيرا مقارنة بالإصدار السابق، GPT-3، والتي يمكنها فقط فهم النص وإخراجه. ومع هذه الميزة الجديدة، GPT-4 يقوم بإنشاء مخرجات نصية بالنظر إلى المدخلات التي تتكون من نصوص وصور متفرقة.

"عبر مجموعة من المجالات - بما في ذلك المستندات التي تحتوي على نصوص وصور فوتوغرافية أو رسوم بيانية أو لقطات شاشة -GPT-4 يُظهر إمكانات مماثلة كما هو الحال في مدخلات النص فقط.

OpenAI كتب.

ChatGPT-4 يتمتع بحجم أكبر من سابقاته، مما يشير إلى أنه خضع للتدريب على كمية أكبر من البيانات ويحتوي على أوزان أكبر في ملف النموذج الخاص به، مما يؤدي إلى ارتفاع تكلفة تشغيله. يمكن لأحدث لغة الذكاء الاصطناعي إنشاء نص يشبه الإنسان باستخدام التعلم العميق وأن يتم تدريبه مسبقًا على مجموعة بيانات كبيرة.

GPT-4 لديها أظهر أداءً فائقًا على لغات الذكاء الاصطناعي الأخرى في مجموعة متنوعة من الاختبارات والاختبارات ويرجع ذلك جزئيًا إلى قدرته على الوصول إلى معلومات وتفاصيل إضافية من خلال الصور التي قد لا تكون متاحة في نموذج مكتوب.

الجديد GPT-4 يمكن للنموذج أن يخبرك بالضبط بما هو مصور في الرسم التوضيحي، ويحلله، بل ويشرح معناه. في العرض التوضيحي، GPT-4 شرح النكتة المرئية حيث يتم توصيل كابل VGA بجهاز iPhone. ويمكن أن يفسر أيضًا ما هو غير عادي في الصورة التي تعرض "الكي الشديد"، والذي يمكنك الاطلاع عليه أدناه.

gpt-4 صور
المصدر OpenAI

ومع ذلك، هناك أيضًا آثار أكثر فائدة GPT-4المعرفة الجديدة. وفي العرض التقديمي، تبين أن PGT-4 يمكنه معرفة ما يمكن طهيه من المكونات الموضحة في الصورة. وهذا يعني أن النموذج يمكن أن يساعدك في الطهي إذا كان لديك منتجات غذائية وليس لديك أدنى فكرة عما يجب فعله بها. التقط لقطة للطعام الذي لديك، وقم بالدردشة-GPT يمكن أن يخبرك بما يمكنك تحضيره من المكونات المتوفرة لديك في المنزل.

هذه القدرة على فهم وتفسير المعلومات المرئية تجعل GPT-4 أداة قوية لمهام مثل التعليق على الصور، والإجابة على الأسئلة المرئية، وحتى إنشاء المحتوى. مع التكامل بين الفهم النصي والمرئي، GPT-4 لديه القدرة على إحداث ثورة في مختلف الصناعات، مثل الإعلان والتصميم والتجارة الإلكترونية، ومساعدة الأشخاص على القيام بالمهام الدنيوية المملة لهم.

المتقدمة نموذج اللغة كما أنه "يفهم" لقطات الشاشة والمستندات التي تحتوي على نصوص أو جداول أو رسوم بيانية أو تمثيلات مرئية أخرى. على سبيل المثال، إذا قمت بتحميل ورقة بحثية من ثلاث صفحات وتحتاج إلى تلخيصها وشرحها، GPT-4 قادر على القيام بذلك. 

أظهر مذيع بلومبيرج Jon Erlichman كيف كان قادرًا على تحويل التصميم المرسوم يدويًا إلى موقع ويب وظيفي.

يمكن أيضًا استخدام التكنولوجيا الجديدة كوسيلة مساعدة على التنقل حيث يمكن استخدامها لوصف البيئة للأشخاص المعاقين بصريًا. تحقيقا لهذه الغاية ، دخلت Open AI بالفعل في شراكة مع تطبيق يسمى أن تكون عيني الذي تم تصميمه لمنح المكفوفين يد العون عندما يحتاجون إلى إلقاء نظرة على شيء ما ، على سبيل المثال ، أثناء تسوق البقالة. يتيح التطبيق "للمتطوعين والمحترفين المبصرين النظر في حل المهام الكبيرة والصغيرة لمساعدة المكفوفين وضعاف البصر على عيش حياة أكثر استقلالية". الآن ، يقدم أيضًا أداة تطوعية افتراضية مدعومة من OpenAIالصورة GPT-4.

بالرغم ان OpenAIالصورة GPT-4 يوفر حاليًا القدرة على معالجة النصوص والصور كمدخلات، إلا أن النموذج ليس مجهزًا بعد للتعامل مع مدخلات الصوت والفيديو. ومع ذلك، هناك دلائل تشير إلى أنه قد يتم تضمين هذه الطرائق في النسخة القادمة من التكنولوجيا.

اقرأ أكثر:

الوسوم (تاج):

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

Agne هي صحفية تغطي أحدث الاتجاهات والتطورات في metaverse و AI و Web3 صناعات ل Metaverse Post. دفعها شغفها بسرد القصص إلى إجراء العديد من المقابلات مع خبراء في هذه المجالات، وتسعى دائمًا للكشف عن قصص مثيرة وجذابة. حصلت أغني على درجة البكالوريوس في الأدب ولديها خلفية واسعة في الكتابة حول مجموعة واسعة من المواضيع بما في ذلك السفر والفن والثقافة. كما تطوعت كمحررة في منظمة حقوق الحيوان، حيث ساعدت في رفع مستوى الوعي حول قضايا رعاية الحيوان. اتصل بها على [البريد الإلكتروني محمي].

المزيد من المقالات
آني سيمرمان
آني سيمرمان

Agne هي صحفية تغطي أحدث الاتجاهات والتطورات في metaverse و AI و Web3 صناعات ل Metaverse Post. دفعها شغفها بسرد القصص إلى إجراء العديد من المقابلات مع خبراء في هذه المجالات، وتسعى دائمًا للكشف عن قصص مثيرة وجذابة. حصلت أغني على درجة البكالوريوس في الأدب ولديها خلفية واسعة في الكتابة حول مجموعة واسعة من المواضيع بما في ذلك السفر والفن والثقافة. كما تطوعت كمحررة في منظمة حقوق الحيوان، حيث ساعدت في رفع مستوى الوعي حول قضايا رعاية الحيوان. اتصل بها على [البريد الإلكتروني محمي].

Hot Stories
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

وصول يوم النطق بالحكم: مصير تشيكوسلوفاكيا معلق في الميزان بينما تنظر المحكمة الأمريكية في التماس وزارة العدل

ومن المقرر أن يواجه Changpeng Zhao الحكم في محكمة أمريكية في سياتل اليوم.

أعرف المزيد

مؤسسو Samourai Wallet متهمون بتسهيل صفقات بقيمة 2 مليار دولار في Darknet

يمثل إلقاء القبض على مؤسسي Samourai Wallet انتكاسة ملحوظة لهذه الصناعة، مما يؤكد استمرار ...

أعرف المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
تتعاون Ankr مع منصة Talus لمنصة AI Blockchain لفتح سيولة Bitcoin للذكاء الاصطناعي
باقة الأعمال تقرير الأخبار تكنولوجيا
تتعاون Ankr مع منصة Talus لمنصة AI Blockchain لفتح سيولة Bitcoin للذكاء الاصطناعي
1 مايو 2024
تدعم Binance Labs مختبرات الحركة لتسهيل تكامل نقل Facebook عبر Blockchains
باقة الأعمال تقرير الأخبار تكنولوجيا
تدعم Binance Labs مختبرات الحركة لتسهيل تكامل نقل Facebook عبر Blockchains
1 مايو 2024
دول البريكس تتطلع إلى حل تجارة العملات المستقرة
باقة الأعمال الأسواق قصص ومراجعات تكنولوجيا
دول البريكس تتطلع إلى حل تجارة العملات المستقرة
1 مايو 2024
تتكامل شبكة Bitcoin L2 BOB مع LayerZero لتعزيز الوظائف
باقة الأعمال تقرير الأخبار تكنولوجيا
تتكامل شبكة Bitcoin L2 BOB مع LayerZero لتعزيز الوظائف
1 مايو 2024
CRYPTOMERIA LABS PTE. المحدودة.