تقرير الأخبار تكنولوجيا
21 سبتمبر 2023

إصدار DALL-E 3 يضخم OpenAIتأثير، الرحيل Midjourney و Stable Diffusion خلف

في سطور

تم إعداد DALL-E 3 ليتم دمجه بسلاسة مع GPT-4، مصممة خصيصا ل ChatGPT+ المشتركين.

يمتنع DALL-E 3 عن إعادة إنشاء صور الشخصيات العامة عندما يتم ذكر أسمائهم صراحة.

تم تحديد الجدول الزمني للوصول إلى DALL-E 3 لشهر أكتوبر.

OpenAI كشفت عن أحدث إبداعاتها: DALL-E3. على عكس الإصدارات السابقة، يركز DALL-E 3 على تحسين التفاصيل الدقيقة، ومعالجة مشكلات مثل الحروف وتفاصيل الجسم المعقدة، مثل الأصابع. النتائج؟ مجموعة من الصور الممتعة من الناحية الجمالية دون الحاجة إلى مطالبات أو حلول معقدة.

إصدار DALL-E 3 يضخم OpenAIتأثير، الرحيل Midjourney و  Stable Diffusion خلف

من المهم ملاحظة أن هذا الإصدار لا يأتي مع مجموعة شاملة من تفاصيل التنفيذ أو المقالات أو واجهات برمجة التطبيقات. وبدلاً من ذلك، تم إعداد DALL-E 3 ليتم دمجه بسلاسة مع GPT-4، مصممة خصيصا ل ChatGPT+ المشتركين.

قد لا يكون هذا التطور بمثابة تحول جذري في مشهد الذكاء الاصطناعي، بل خطوة إلى الأمام في التعاون بين النماذج. ويتوقع الكثيرون أن القادم Stable Diffusion نموذج سوف توفر قدرًا أكبر من التطور والجاذبية الفنية.

لوضعها في السياق ، OpenAIلقد كانت رحلة إنشاء الصور باستخدام الذكاء الاصطناعي رحلة ممتعة للغاية:

  • 2021: تم تقديم DALL-E 1، وهو نموذج ذو 12 مليار معلمة، بمعلومات محدودة.
  • 2021: تم الكشف عن GLIDE، وهو نموذج ذو 2 مليار معلمة، بالإضافة إلى نماذج مفتوحة المصدر تضم 300 مليون معلمة.
  • 2022: وصل DALL-E 2، مزودًا بـ 2 مليار معلمة، مصحوبة بورقة unCLIP وواجهة برمجة التطبيقات (API).
  • 2023: لقد دخلت DALL-E 3، وعلى الرغم من أن التفاصيل قد تكون غامضة إلى حد ما، إلا أن هناك شيء واحد واضح وهو أنها سوف تتكامل مع GPT-4 For ChatGPT+ المشتركين.

اعتبارًا من الآن، تظل صور DALL-E 3 نادرة إلى حد ما. لا توجد قاعدة تعليمات برمجية أو منشور مدونة أو مقارنة تفصيلية مع أحدث إصدار (SOTA). OpenAI يبدو أنهم يحتفظون ببطاقاتهم بالقرب من صدورهم.

إصدار DALL-E 3 يضخم OpenAIتأثير، الرحيل Midjourney و  Stable Diffusion خلف

يُوصف النموذج بأنه يمتلك فهمًا أعمق للفروق الدقيقة والتفاصيل مقارنةً بأسلافه. وهذا يعني أن ترجمة مفاهيمك الإبداعية إلى صور دقيقة للغاية من المتوقع أن تكون عملية أكثر سلاسة.

أحد الوعد المثير للاهتمام لـ DALL-E 3 هو تكامله مع ChatGPT. وهذا يعني أن المستخدمين لن يحتاجوا إلى التعامل مع صياغة مطالبات معقدة؛ ينبغي أن يكون وصفا موجزا كافيا، مع ChatGPT إنشاء مطالبات تفصيلية ببراعة نيابة عنك.

OpenAI وشدد أيضًا على أهمية السياق في المطالبات الطويلة. تم تصميم DALL-E 3 ليشمل الإسهاب، مما يجعله أكثر انسجامًا مع السياق الموصوف في المطالبات الشاملة.

ومع ذلك، كما هو الحال مع أي نموذج جديد للذكاء الاصطناعي، هناك عنصر مجهول. وفي حين تبدو اللمحات الأولية واعدة، فإن الاختبار الحقيقي سيأتي مع الاستخدام الممتد. وتظل الأسئلة قائمة حول كفاءتها وسرعة عملها.

من المحتمل أن تكون DALL-E 3 عبارة عن عملية انتشار متعددة المراحل GPT-4 بمثابة التشفير النص. قد تظل الآليات المعقدة لهذا الإعداد محاطة بالسرية.

تم تحديد الجدول الزمني للوصول إلى DALL-E 3 لشهر أكتوبر، مبدئيًا لـ ChatGPT بالإضافة إلى و ChatGPT مستخدم المؤسسةمع إمكانية الوصول على نطاق أوسع للباحثين بعد ذلك.

مقالات ذات صلة: OpenAIألتمان في مجلس الشيوخ الأمريكي لمناقشة مخاطر الذكاء الاصطناعي

التظليل و رقابة دال-E 3

كانت النقاط المحورية الأساسية لتطوير DALL-E 3 هي العملية الدقيقة للحد من قدراتها. وتضمن ذلك محاذاة صارمة ومرشحات مصممة لاستبعاد أنواع معينة من المحتوى. على سبيل المثال، يرفض النموذج بشدة إنشاء صور لشخصيات مشهورة، أو تكرار الأعمال الفنية بأسلوب الفنانين المشهورين، أو إنشاء أي محتوى يعتبر غير آمن من قبل OpenAIالمعايير المميزة. لا يقتصر هذا النهج الاستراتيجي على القيود فحسب؛ إنه إجراء استباقي يهدف إلى حماية الشركة من التشابكات القانونية المحتملة.

ومع ذلك، وبعيدًا عن هذه المرشحات والمحاذاة، ظهرت إلى النور بعض الملاحظات المثيرة للاهتمام. يبدو أن DALL-E 3 يُظهر ضعفًا معينًا عندما يتعلق الأمر بإنشاء محتوى واقعي. بدلاً من إنتاج صور تحاكي الصور الفوتوغرافية الحقيقية بشكل لا تشوبه شائبة، فإن الإخراج يحمل جودة منمقة مميزة. تضفي هذه الصور المصنّعة بواسطة الذكاء الاصطناعي مظهرًا بلاستيكيًا تقريبًا. وحتى عند المطالبة صراحةً بكلمة "صورة"، تظل النتيجة راسخة في أسلوبها المميز.

موجه # 1
الموجه رقم 1: صورة مقربة لسرطان البحر الناسك مستلقيًا في الرمال الرطبة، مع وجود زبد البحر بالقرب منه وإبراز تفاصيل قشرته وملمس الرمال.
موجه # 2
المطالبة رقم 2: توجد أريكة صفراء نابضة بالحياة على شكل موزة في غرفة معيشة مريحة، ويحتضن منحنىها كومة من الوسائد الملونة. على الأرضية الخشبية، تضيف السجادة المزخرفة لمسة من السحر الانتقائي، ويوجد نبات في أصيص في الزاوية، يصل نحو ضوء الشمس المتسلل عبر النافذة.
موجه # 3
الموجه رقم 3: صورة لحطام سفينة قديمة تقع في قاع المحيط. وقد سيطرت النباتات البحرية على الهيكل الخشبي، وتسبح الأسماك داخل وخارج مساحاته المجوفة. وتنتشر الكنوز الغارقة والمدافع القديمة في كل مكان، مما يوفر لمحة عن الماضي.

ومن الجدير بالذكر أنه على الرغم من هذه الخصوصيات، فإن DALL-E 3 يقدم لمحة عن الإمكانات الرائعة. من بين إبداعاتها، تظهر بعض الحالات تشابهًا مذهلاً مع الصور الفوتوغرافية. يجب الأخذ في الاعتبار أن محاكاة الواقعية لهذه الصور لا تتوافق بالضرورة مع كيفية ظهور الصورة الحقيقية لنفس الموضوع، خاصة إذا كانت مغمورة تحت الماء.

مقالات ذات صلة: كشفت Microsoft النقاب عن برنامج Designer ، أول أداة احترافية لتحويل النص إلى صورة تعتمد على DALL-E 2

DALL-E 3 الميزات والتفاصيل

دعونا نتوقف لحظة للتدقيق في وحدات البكسل والقراءة بين السطور لفهم ما يقدمه هذا النموذج الجديد حقًا.

فن الأسلوب: نظرة خاطفة OpenAIحساب Instagram الخاص بـ، ستلاحظ وفرة من الأعمال الفنية التي تتميز بأسلوب رائع. في حين أن هناك مجموعة رائعة من التركيبات والتصميمات المجردة، يبدو أن النموذج يبتعد عن إنتاج محتوى واقعي. وينصب التركيز هنا على الجماليات والإبداع، وليس محاكاة الواقع.

القيود الفنية: يأخذ DALL-E 3 مسارًا مختلفًا عن سابقته. إنها ترفض بشدة إنشاء صور بأسلوب الفنانين الأحياء، وهو خروج صارخ عن DALL-E 2، والتي يمكن أن تقلد أنماط فنانين معينين. وهذا قد يثير الدهشة في المجتمع الإبداعي، على غرار الاستقبال الفاتر لـ Stable Diffusion 2.0

تمكين الفنانين: في خطوة لاحترام حقوق الفنانين، OpenAI يسمح للفنانين باستبعاد أعمالهم من إصدارات DALL-E المستقبلية. من خلال إرسال صورة يمتلكون حقوقها، يمكن للفنانين طلب استبعادها من مخرجات النموذج. سوف تتجنب التكرارات المستقبلية لـ DALL-E إنشاء محتوى يشبه ملف أسلوب الفنان.

الأمن والرقابة: OpenAIإن جنون العظمة بشأن الأمن واضح. لقد تعاونوا مع "فرق حمراء" خارجية لاختبار أمان النموذج واستخدموا مصنفات الإدخال لتعليم النموذج كيفية تجاهل كلمات معينة قد تؤدي إلى محتوى صريح أو ضار. يمتنع DALL-E 3 عن إعادة إنشاء صور الشخصيات العامة عندما يتم ذكر أسمائهم صراحة. لا يزال من غير المؤكد ما إذا كان المشاهير يندرجون ضمن هذه الفئة، مما قد يؤثر على جودة الوجوه التي يتم إنشاؤها.

العلامات المائية والتتبع: هناك تلميح إلى تضمين علامات لتتبع "الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي"، مما يشير إلى التحرك نحو مراقبة أفضل واحتمال إنشاء محتوى تم إنشاؤه بواسطة علامات مائية.

تحسين النص واليدين: OpenAI تروج لإنشاء نص محسّن وعرض يدوي، وهو ادعاء شائع بين المنافسين. ويكمن الاختبار الحقيقي في الناتج الفعلي الذي يتجاوز الأمثلة المنتقاة.

الفهم المكاني: DALL-E 3 يتفوق في فهم العلاقات المكانية الموضحة في المطالبات. وهذا يعزز قدرة النموذج على بناء زوايا وتركيبات معقدة، على الرغم من أن المستخدمين ينتظرون المزيد من الأدلة الملموسة على هذا الوعد.

قوة المطالبات: جوهر DALL-E3 يكمن في قدراته السريعة والتكامل مع ChatGPT. يعد بالأتمتة والسرعة وتبسيط التصميم الفوري. الاتجاه هنا هو نحو chatGPT توليد المطالبات، ترجمة الأفكار الغامضة أو المطالبات البدائية إلى أفكار بليغة. يعمل الفهم السياقي المحسن لـ DALL-E 3 على تبسيط العملية، مما يسمح للمستخدمين بالتركيز على النية بدلاً من الإسهاب.

الأقاليم المجهولة: تغيب بشكل ملحوظ عن المناقشة جوانب مثل الرسم الداخلي، والرسم الخارجي، والتعبئة التوليدية، والنمذجة ثلاثية الأبعاد. قد يكون غياب هذه الميزات عائقًا، خاصة بالنسبة للمستخدمين المعتادين على نماذج أكثر تنوعًا.

تفاصيل الوصول: DALL-E 3 من المقرر أن يصبح متاحًا لـ ChatGPT عملاء Plus وEnterprise في أوائل شهر أكتوبر. ومع ذلك، فإن التفاصيل المتعلقة بتخصيص الاعتمادات ل ChatGPT بالإضافة إلى المستخدمين والتكاليف المرتبطة بها لا تزال غير واضحة. سيتم توفير الوصول عبر API و OpenAI منصة Labs "في وقت لاحق من الخريف".

براعة التكامل: تم إعداد DALL-E ليتم دمجه بسلاسة في منتجات الشركاء ومنتجات Microsoft. توقع أن تشهد إنشاء العروض التقديمية والرسوم التوضيحية والتصميمات والشعارات، كل ذلك في السياق ويتم تضخيمه بمساعدة من ChatGPT. ومن المقرر أن يصبح هذا التكامل سائدًا، مما يشكل تحديًا كبيرًا للمنافسين مثل جوجل مع بارد لها و إيديوجرام.

التقارب بين LLM والمحتوى المرئي: الجانب الأكثر إثارة للاهتمام يكمن في تقارب نماذج اللغات الكبيرة (LLMs) ونماذج إنشاء المحتوى المرئي. إنه يدل على التحول من الهندسة السريعة المعقدة إلى التعبير عن الأفكار بلغة يسهل الوصول إليها. سوف يقوم الذكاء الاصطناعي باستخلاص السياق والأفكار من هذه التعبيرات، مما يوفر إمكانيات إبداعية يصعب مقاومتها.

مقالات ذات صلة: أفضل 50 موجهًا لتحويل النص إلى صورة لمولدي الفن بالذكاء الاصطناعي Midjourney و DALL-E

DALL-E 3: كن قائدًا جديدًا في مجال توليد الصور بالذكاء الاصطناعي

OpenAIقرار دمج DALL-E 3 في ChatGPT النظام البيئي هو خطوة استراتيجية. يمنح هذا التكامل DALL-E 3 إمكانية الوصول إلى قاعدة بيانات مستخدمين واسعة تضم 100 مليون مستخدم نشط. تعمل هذه الخطوة على تحسين إمكانية الوصول إلى DALL-E 3 بشكل كبير ولديها القدرة على زيادة شعبيتها.

حاليا، Midjourney و Stable Diffusion تتباهى حولها 15 مليون مستخدم مسجل. ومع ذلك، مع هذا التكامل، تم إعداد DALL-E 3 للوصول إلى قاعدة مستخدمين أكبر بعشر مرات - 100 مليون مستخدم. وهذا يجعل ChatGPT اشتراك بلس التخطيط أكثر جاذبية، لأنه يوفر إمكانية الوصول إلى برنامج الدردشة الآلي، والأدوات التحليلية، وتوليد الصور، كل ذلك بسعر في المتناول.

لا يعد التكامل مفيدًا للمستخدمين الحاليين فحسب، بل يعمل أيضًا كنقطة جذب قوية للمستخدمين الجدد. إنه يوسع OpenAI مدى انتشار النظام البيئي وشعبيته، مما يجذب الأفراد الذين يبحثون عن حلول المحتوى التي ينشئها الذكاء الاصطناعي.

ومن المتوقع أن تعزز هذه الخطوة الاستراتيجية OpenAIالإيرادات والمقاييس الرئيسية الأخرى. من المرجح أن ينظر مستثمرو الشركة إلى هذا التطور بشكل إيجابي، خاصة في ضوء الأحداث الأخيرة انخفاض بنسبة 20% في حجم حركة المرور خلال الصيف.

ChatGPT تنخفض حركة مرور الويب بنسبة 20% في سبتمبر وتستمر في الانخفاض

اقرأ المزيد من الموضوعات ذات الصلة:

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

المزيد من المقالات
دامير يالالوف
دامير يالالوف

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

Hot Stories
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

من Ripple إلى The Big Green DAO: كيف تساهم مشاريع العملة المشفرة في الأعمال الخيرية

دعونا نستكشف المبادرات التي تستغل إمكانات العملات الرقمية لأغراض خيرية.

لمعرفة المزيد

AlphaFold 3 وMed-Gemini وآخرون: الطريقة التي يغير بها الذكاء الاصطناعي الرعاية الصحية في عام 2024

يتجلى الذكاء الاصطناعي بطرق مختلفة في مجال الرعاية الصحية، بدءًا من الكشف عن الارتباطات الجينية الجديدة وحتى تمكين الأنظمة الجراحية الروبوتية...

لمعرفة المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
أفضل 10 أدوات ذكاء اصطناعي مجانية لإنشاء المحتوى وتحرير الفيديو والمزيد
AI Wiki استوعب التعليم أسلوب الحياة تطبيقات الكمبيوتر تكنولوجيا
أفضل 10 أدوات ذكاء اصطناعي مجانية لإنشاء المحتوى وتحرير الفيديو والمزيد
14 مايو 2024
هيئة الأوراق المالية في هونغ كونغ تحذر من عمليات الاحتيال العميق التي تستهدف صناعة العملات المشفرة: الآثار المترتبة على سلامة المستثمرين
أسلوب الحياة حماية Wiki تطبيقات الكمبيوتر قصص ومراجعات تكنولوجيا
هيئة الأوراق المالية في هونغ كونغ تحذر من عمليات الاحتيال العميق التي تستهدف صناعة العملات المشفرة: الآثار المترتبة على سلامة المستثمرين
14 مايو 2024
تتعاون Ripple وEvmos في تطوير XRP Ledger EVM Sidechain باستخدام تقنية EvmOS
باقة الأعمال تقرير الأخبار تكنولوجيا
تتعاون Ripple وEvmos في تطوير XRP Ledger EVM Sidechain باستخدام تقنية EvmOS
14 مايو 2024
5ireChain تطلق مبادرة "Testnet Thunder: GA" التحفيزية لاختبار إجهاد الشبكة، وتدعو المستخدمين للمشاركة في Airdrop الجوائز
تقرير الأخبار تكنولوجيا
5ireChain تطلق مبادرة "Testnet Thunder: GA" التحفيزية لاختبار إجهاد الشبكة، وتدعو المستخدمين للمشاركة في Airdrop الجوائز
14 مايو 2024
CRYPTOMERIA LABS PTE. المحدودة.