تقرير الأخبار تكنولوجيا
17 نوفمبر، 2022

أعلنت Nvidia عن eDiff-I: ذكاء اصطناعي جديد لتوليف النصوص والصور مع النقل الفوري للأنماط

في سطور

تطلق Nvidia eDiff-I لمساعدة الشركات على إنشاء صور عالية الجودة وجذابة

تنتج تقنية eDiff-I بانتظام جودة تخليقية أكبر من DALL-E2 و Stable diffusion

eDiff-I هي أداة إنشاء محتوى AI جديدة ويوفر إمكانات غير مسبوقة في تركيب تحويل النص إلى صورة للمسوقين والشركات ، كما أعلن مؤخرًا NVIDIA. باستخدام eDiff-I ، يمكن للشركات إنشاء صور مرئية عالية الجودة بسرعة وسهولة دون الحاجة إلى معدات باهظة الثمن أو مساعدة احترافية. يستخدم eDiff-I معالجة اللغة الطبيعية (NLP) لتفسير مدخلات المستخدم وإنشاء الصور المقابلة. يقوم الذكاء الاصطناعي بعد ذلك بتحليل الصور واختيار أنسبها بناءً على السياق. والنتيجة هي صورة عالية الجودة وذات مظهر احترافي يمكن استخدامها لمجموعة متنوعة من الأغراض ، مثل المواد التسويقية ومنشورات الوسائط الاجتماعية وحملات البريد الإلكتروني والمزيد.

eDiff-I هو ملف الجيل القادم من الذكاء الاصطناعي أداة إنشاء المحتوى التي لا مثيل لها نص إلى صورة التوليف ونقل الأسلوب السريع واللوحة البديهية بالكلمات. كنموذج انتشار لإنشاء صور من النص ، يقترح eDiff-I تدريب مجموعة من شبكات تقليل الضوضاء الخبيرة ، كل منها متخصص في فترة ضوضاء معينة ، استجابةً للنتيجة التجريبية التي تفيد بأن سلوك نماذج الانتشار يختلف في مراحل مختلفة من أخذ العينات.

أعلنت Nvidia عن eDiff-I: ذكاء اصطناعي جديد لتوليف النصوص والصور مع النقل الفوري للأنماط

توفر حفلات الزفاف النصية T5 وحفلات الزفاف في صورة CLIP وحفلات الزفاف النصية CLIP الأساس لمفهوم eDiff-I. يمكن أن تنتج هذه المنهجية رسومات واقعية ردًا على أي استعلام نصي.

يقدم إمكانيتين إضافيتين بالإضافة إلى تركيب النص إلى صورة: (1) نقل النمط ، والذي يسمح لنا بالتحكم في نمط العينة المُنشأة باستخدام صورة نمط مرجعي ، و (2) أداة "الرسم بالكلمات" يسمح للمستخدمين بإنشاء صور عن طريق رسم خرائط التجزئة على قماش.

خط أنابيب
خط أنابيب

يتكون خط الأنابيب من سلسلة من ثلاثة نماذج نشر: نموذج أساسي يمكنه إنشاء عينات بدقة 64×64 ومجموعتين فائقتي الدقة يمكنهما رفع عينات الصور تدريجيًا إلى دقة 256×256 و1024×1024، على التوالي. تقوم النماذج بحساب T5 XXL وتضمين النص بعد تلقي تسمية توضيحية كمدخل. يمكن استخدام تضمينات الصور هذه كمتجه للأسلوب. ثم قم بتغذية هذه التضمينات في شلالتنا نماذج الانتشار، والتي تنتج تدريجيًا صورًا بدقة 1024 × 1024.

يؤدي نهج eDiff-I باستمرار إلى جودة تركيب أفضل عند مقارنته بخوارزميات تحويل النص إلى صورة مفتوحة المصدر (Stable diffusion) و (DALL-E2).

النتائج
النتائج

عندما يتم استخدام زينة صورة CLIP ، فإن نهج eDiff-I يسهل نقل النمط. يقوم eDiff-I أولاً باستخراج ملف CLIP تضمين الصور من صورة نمط مرجعي ، والتي يمكن استخدامها كمتجه مرجعي للنمط. يمكن رؤية مرجع أسلوبي في اللوحة اليسرى بالشكل أدناه. يتم عرض النتائج عند تشغيل تكييف النمط في اللوحة المركزية. يتم عرض النتائج عند إيقاف تشغيل تكييف النمط في اللوحة الموجودة على اليمين. عند تطبيق تكييف النمط ، يُنشئ نموذج eDiff-I مخرجات تتوافق مع نمط التسمية التوضيحية للإدخال أيضًا. عند إيقاف تكييف النمط ، يتم إنتاج صور ذات مظهر طبيعي.

نقل النمط
نقل النمط

عن طريق اختيار العبارات وكتابتها على الصورة ، يمكن لمستخدمي طريقة eDiff-I تغيير موضع الأشياء المدرجة في موجه النص. بعد ذلك ، يستخدم النموذج ملف موجه وخرائط لإنشاء الصور التي تتوافق مع كل من التسمية التوضيحية وخريطة الإدخال.

اقرأ المقالات ذات الصلة:

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

المزيد من المقالات
دامير يالالوف
دامير يالالوف

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

Hot Stories
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

وصول يوم النطق بالحكم: مصير تشيكوسلوفاكيا معلق في الميزان بينما تنظر المحكمة الأمريكية في التماس وزارة العدل

ومن المقرر أن يواجه Changpeng Zhao الحكم في محكمة أمريكية في سياتل اليوم.

أعرف المزيد

مؤسسو Samourai Wallet متهمون بتسهيل صفقات بقيمة 2 مليار دولار في Darknet

يمثل إلقاء القبض على مؤسسي Samourai Wallet انتكاسة ملحوظة لهذه الصناعة، مما يؤكد استمرار ...

أعرف المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
تستثمر Pantera Capital في TON Blockchain، وتعرب عن ثقتها في قدرة Telegram على توسيع إمكانية الوصول إلى العملات المشفرة
باقة الأعمال تقرير الأخبار تكنولوجيا
تستثمر Pantera Capital في TON Blockchain، وتعرب عن ثقتها في قدرة Telegram على توسيع إمكانية الوصول إلى العملات المشفرة
2 مايو 2024
تجمع شركة Mitosis تمويلًا بقيمة 7 ملايين دولار من Amber Group وForesight Ventures لتطوير بروتوكول السيولة المعياري الخاص بها
باقة الأعمال تقرير الأخبار تكنولوجيا
تجمع شركة Mitosis تمويلًا بقيمة 7 ملايين دولار من Amber Group وForesight Ventures لتطوير بروتوكول السيولة المعياري الخاص بها
2 مايو 2024
تتعاون شركة Galxe مع Jambo لتوسيع إمكانية الوصول العالمية إلى Web3
باقة الأعمال تقرير الأخبار تكنولوجيا
تتعاون شركة Galxe مع Jambo لتوسيع إمكانية الوصول العالمية إلى Web3
2 مايو 2024
Google Med-Gemini يستعد لإعطاء السبق لـ GPT-4 مع أدائها المتفوق في مجال الرعاية الصحية
AI Wiki الأخبار تطبيقات الكمبيوتر تكنولوجيا
Google Med-Gemini يستعد لإعطاء السبق لـ GPT-4 مع أدائها المتفوق في مجال الرعاية الصحية
2 مايو 2024
CRYPTOMERIA LABS PTE. المحدودة.