تقرير الأخبار
06 نوفمبر، 2022

ERNIE-ViLG 2.0: يتفوق نموذج تحويل النص إلى صورة الجديد من Baidu على Dalle-2 و Stable Diffusion

في سطور

كل من Dalle-2 و Stable Diffusion تم تفوق أداء ERNIE-ViLG 2.0 بشكل ملحوظ

ERNIE-ViLG 2.0 تحديث هو نموذج نص إلى صورة يقدم أداءً أفضل من Dalle-2 و Stable Diffusion، وهما من أشهر نماذج تحويل النص إلى صورة المتاحة حاليًا. تم تصميم النموذج الجديد وتدريبه من قبل فريق من الباحثين من بايدو ، وكانت النتائج مذهلة.

يتفوق نموذج تحويل النص إلى صورة ERNIE-ViLG 2.0 الجديد على أداء Dalle-2 و Stable Diffusion
الصورة التي تم إنشاؤها بواسطة ERNIE-ViLG 2.0

أظهرت النتائج أن ERNIE-ViLG 2.0 تفوق بشكل كبير على أداء Dalle-2 و Stable Diffusion. يعد هذا إنجازًا مهمًا ويظهر قوة إطار عمل ERNIE. ال Metaverse Post قارن الفريق ERNIE-ViLG 2.0 مع Stable Diffusion أدناه:

ERNIE-ViLG 2.0 تحديث
Stable Diffusion
ERNIE-ViLG 2.0 تحديث
Stable Diffusion
ERNIE-ViLG 2.0 تحديث
Stable Diffusion
ERNIE-ViLG 2.0 تحديث
Stable Diffusion
ERNIE-ViLG 2.0 تحديث

توفر هذه النتائج دعمًا قويًا للفرضية القائلة بأن ERNIE-ViLG 2.0 أكثر فعالية نظام تحويل النص إلى صورة من Dalle-2 و Stable Diffusion.

هندسة Unet من Stable Diffusion تؤخذ كأساس ، ولكن مع التغييرات:

  • مزيج من خبراء تقليل الضوضاء: هناك 10 شبكات عصبية بدلاً من شبكة واحدة ، كل منها مسؤول فقط عن خطوات انتشار معينة.
  • المعرفة النصية: أعاد وزن الكلمات الموجودة في الاستعلام تلقائيًا بحيث تزداد أهمية الكلمات الرئيسية.
  • المعرفة البصرية: أثناء التدريب ، تم اكتشاف الأجسام في نتائج التوليد الوسيطة ، وزاد وزن وظيفة الخسارة في المناطق التي بها أشياء.

نتيجة لذلك ، أكبر في العالم نموذج نص إلى صورة خرج مع 24 مليار معلمة (10 مرات أكبر من SD) لتدريب النموذج.

بالمقارنة مع النماذج السابقة، فإن ERNIE-ViLG 2.0 يتفوق عليها بشكل كبير من حيث جودة الصورة ومطابقة الصورة مع النص عند اختباره في وقت واحد على ViLG-300 ثنائي اللغة موجه وضعها شخص.

تتم ترجمة الموجهات ببساطة من الصينية إلى الإنجليزية تلقائيًا في تعانق الوجه عرض عام قبل إرساله إلى منظمة العفو الدولية. الكثير من الميزات تتدفق من هذا.

  • إرني لا يعرف الشخصيات العامة الدولية. على سبيل المثال ، لا يعرف إيرني أرنولد شوارزنيجر. لديها بالتأكيد المفضلة المحلية في الصين.
  • ونتيجة لذلك، فإن طريقة استخدام أسماء المشاهير تؤدي إلى تعزيز جودة المحتوى بشكل كبير وجوه فشل.
  • يمكنك أن تتوقع بعض التشويه بسبب الترجمة من الصينية ، لذلك قد تكون هناك بعض المفاجآت في المتجر لك إذا كنت لا تتحدث الصينية.
  • إنه لا يعرف حتى أي شيء عن جريج روتكوفسكي.

اقرأ المقالات ذات الصلة:

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

المزيد من المقالات
دامير يالالوف
دامير يالالوف

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

Hot Stories

Injective تتعاون مع AltLayer لجلب الأمن إلى inEVM

by أليسا ديفيدسون
03 مايو 2024
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

Injective تتعاون مع AltLayer لجلب الأمن إلى inEVM

by أليسا ديفيدسون
03 مايو 2024

تنمو الشهية المؤسسية تجاه صناديق الاستثمار المتداولة في البيتكوين وسط التقلبات

تكشف الإفصاحات من خلال ملفات 13F عن مستثمرين مؤسسيين بارزين يشتغلون بصناديق الاستثمار المتداولة في البيتكوين، مما يؤكد القبول المتزايد لـ ...

أعرف المزيد

وصول يوم النطق بالحكم: مصير تشيكوسلوفاكيا معلق في الميزان بينما تنظر المحكمة الأمريكية في التماس وزارة العدل

ومن المقرر أن يواجه Changpeng Zhao الحكم في محكمة أمريكية في سياتل اليوم.

أعرف المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
Injective تتعاون مع AltLayer لجلب الأمن إلى inEVM
باقة الأعمال تقرير الأخبار تكنولوجيا
Injective تتعاون مع AltLayer لجلب الأمن إلى inEVM
3 مايو 2024
تتعاون Masa مع Teller لتقديم مجمع إقراض MASA، مما يتيح اقتراض USDC على القاعدة
الأسواق تقرير الأخبار تكنولوجيا
تتعاون Masa مع Teller لتقديم مجمع إقراض MASA، مما يتيح اقتراض USDC على القاعدة
3 مايو 2024
تطلق Velodrome الإصدار التجريبي من Superchain في الأسابيع القادمة وتتوسع عبر OP Stack Layer 2 Blockchains
الأسواق تقرير الأخبار تكنولوجيا
تطلق Velodrome الإصدار التجريبي من Superchain في الأسابيع القادمة وتتوسع عبر OP Stack Layer 2 Blockchains
3 مايو 2024
تعلن CARV عن شراكة مع Aethir لتحقيق اللامركزية في طبقة البيانات الخاصة بها وتوزيع المكافآت
باقة الأعمال تقرير الأخبار تكنولوجيا
تعلن CARV عن شراكة مع Aethir لتحقيق اللامركزية في طبقة البيانات الخاصة بها وتوزيع المكافآت
3 مايو 2024
CRYPTOMERIA LABS PTE. المحدودة.