GPT-4 يمكنه التعامل مع طلباتك الخاصة بالصور والمستندات والرسوم البيانية ولقطات الشاشة
في سطور
GPT-4 يمكنه التعامل مع طلبات الصور والمستندات والرسوم البيانية ولقطات الشاشة. إنه تحسن GPT-3، والتي تتعامل مع النص فقط.
GPT-4 يتمتع بأداء متفوق في الامتحانات والاختبارات المختلفة ويمكنه الوصول إلى معلومات وتفاصيل إضافية من خلال الصور التي قد لا تكون متوفرة في شكل مكتوب.
OpenAIأحدث معلم ، النموذج الجديد GPT-4، يمكنه قبول الطلبات التي تتضمن صورًا أو مستندات تحتوي على نص أو رسوم بيانية أو لقطات شاشة كمدخلات. ويمثل هذا تحسنا كبيرا مقارنة بالإصدار السابق، GPT-3، والتي يمكنها فقط فهم النص وإخراجه. ومع هذه الميزة الجديدة، GPT-4 يقوم بإنشاء مخرجات نصية بالنظر إلى المدخلات التي تتكون من نصوص وصور متفرقة.
"عبر مجموعة من المجالات - بما في ذلك المستندات التي تحتوي على نصوص وصور فوتوغرافية أو رسوم بيانية أو لقطات شاشة -GPT-4 يُظهر إمكانات مماثلة كما هو الحال في مدخلات النص فقط.
OpenAI كتب.
ChatGPT-4 يتمتع بحجم أكبر من سابقاته، مما يشير إلى أنه خضع للتدريب على كمية أكبر من البيانات ويحتوي على أوزان أكبر في ملف النموذج الخاص به، مما يؤدي إلى ارتفاع تكلفة تشغيله. يمكن لأحدث لغة الذكاء الاصطناعي إنشاء نص يشبه الإنسان باستخدام التعلم العميق وأن يتم تدريبه مسبقًا على مجموعة بيانات كبيرة.
GPT-4 لديها أظهر أداءً فائقًا على لغات الذكاء الاصطناعي الأخرى في مجموعة متنوعة من الاختبارات والاختبارات ويرجع ذلك جزئيًا إلى قدرته على الوصول إلى معلومات وتفاصيل إضافية من خلال الصور التي قد لا تكون متاحة في نموذج مكتوب.
الجديد GPT-4 يمكن للنموذج أن يخبرك بالضبط بما هو مصور في الرسم التوضيحي، ويحلله، بل ويشرح معناه. في العرض التوضيحي، GPT-4 شرح النكتة المرئية حيث يتم توصيل كابل VGA بجهاز iPhone. ويمكن أن يفسر أيضًا ما هو غير عادي في الصورة التي تعرض "الكي الشديد"، والذي يمكنك الاطلاع عليه أدناه.
ومع ذلك، هناك أيضًا آثار أكثر فائدة GPT-4المعرفة الجديدة. وفي العرض التقديمي، تبين أن PGT-4 يمكنه معرفة ما يمكن طهيه من المكونات الموضحة في الصورة. وهذا يعني أن النموذج يمكن أن يساعدك في الطهي إذا كان لديك منتجات غذائية وليس لديك أدنى فكرة عما يجب فعله بها. التقط لقطة للطعام الذي لديك، وقم بالدردشة-GPT يمكن أن يخبرك بما يمكنك تحضيره من المكونات المتوفرة لديك في المنزل.
هذه القدرة على فهم وتفسير المعلومات المرئية تجعل GPT-4 أداة قوية لمهام مثل التعليق على الصور، والإجابة على الأسئلة المرئية، وحتى إنشاء المحتوى. مع التكامل بين الفهم النصي والمرئي، GPT-4 لديه القدرة على إحداث ثورة في مختلف الصناعات، مثل الإعلان والتصميم والتجارة الإلكترونية، ومساعدة الأشخاص على القيام بالمهام الدنيوية المملة لهم.
المتقدمة نموذج اللغة كما أنه "يفهم" لقطات الشاشة والمستندات التي تحتوي على نصوص أو جداول أو رسوم بيانية أو تمثيلات مرئية أخرى. على سبيل المثال، إذا قمت بتحميل ورقة بحثية من ثلاث صفحات وتحتاج إلى تلخيصها وشرحها، GPT-4 قادر على القيام بذلك.
أظهر مذيع بلومبيرج Jon Erlichman كيف كان قادرًا على تحويل التصميم المرسوم يدويًا إلى موقع ويب وظيفي.
يمكن أيضًا استخدام التكنولوجيا الجديدة كوسيلة مساعدة على التنقل حيث يمكن استخدامها لوصف البيئة للأشخاص المعاقين بصريًا. تحقيقا لهذه الغاية ، دخلت Open AI بالفعل في شراكة مع تطبيق يسمى أن تكون عيني الذي تم تصميمه لمنح المكفوفين يد العون عندما يحتاجون إلى إلقاء نظرة على شيء ما ، على سبيل المثال ، أثناء تسوق البقالة. يتيح التطبيق "للمتطوعين والمحترفين المبصرين النظر في حل المهام الكبيرة والصغيرة لمساعدة المكفوفين وضعاف البصر على عيش حياة أكثر استقلالية". الآن ، يقدم أيضًا أداة تطوعية افتراضية مدعومة من OpenAIالصورة GPT-4.
بالرغم ان OpenAIالصورة GPT-4 يوفر حاليًا القدرة على معالجة النصوص والصور كمدخلات، إلا أن النموذج ليس مجهزًا بعد للتعامل مع مدخلات الصوت والفيديو. ومع ذلك، هناك دلائل تشير إلى أنه قد يتم تضمين هذه الطرائق في النسخة القادمة من التكنولوجيا.
اقرأ أكثر:
- أفضل 7 شركات اعتمدتها GPT-4
- GPT-4-على أساس ChatGPT يتفوق GPT-3 بعامل 570
- تؤكد Microsoft أن Bing يعمل على المستوى المتقدم GPT-4 الموديل
- GPT-4 مقابل GPT-3: ما الذي يجب أن يقدمه النموذج الجديد؟
إخلاء المسئولية
تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.
نبذة عن الكاتب
Agne هي صحفية تغطي أحدث الاتجاهات والتطورات في metaverse و AI و Web3 صناعات ل Metaverse Post. دفعها شغفها بسرد القصص إلى إجراء العديد من المقابلات مع خبراء في هذه المجالات، وتسعى دائمًا للكشف عن قصص مثيرة وجذابة. حصلت أغني على درجة البكالوريوس في الأدب ولديها خلفية واسعة في الكتابة حول مجموعة واسعة من المواضيع بما في ذلك السفر والفن والثقافة. كما تطوعت كمحررة في منظمة حقوق الحيوان، حيث ساعدت في رفع مستوى الوعي حول قضايا رعاية الحيوان. اتصل بها على [البريد الإلكتروني محمي].
المزيد من المقالاتAgne هي صحفية تغطي أحدث الاتجاهات والتطورات في metaverse و AI و Web3 صناعات ل Metaverse Post. دفعها شغفها بسرد القصص إلى إجراء العديد من المقابلات مع خبراء في هذه المجالات، وتسعى دائمًا للكشف عن قصص مثيرة وجذابة. حصلت أغني على درجة البكالوريوس في الأدب ولديها خلفية واسعة في الكتابة حول مجموعة واسعة من المواضيع بما في ذلك السفر والفن والثقافة. كما تطوعت كمحررة في منظمة حقوق الحيوان، حيث ساعدت في رفع مستوى الوعي حول قضايا رعاية الحيوان. اتصل بها على [البريد الإلكتروني محمي].