تقرير الأخبار
06 نوفمبر، 2022

ERNIE-ViLG 2.0: يتفوق نموذج تحويل النص إلى صورة الجديد من Baidu على Dalle-2 و Stable Diffusion

في سطور

كل من Dalle-2 و Stable Diffusion تم تفوق أداء ERNIE-ViLG 2.0 بشكل ملحوظ

ERNIE-ViLG 2.0 تحديث هو نموذج نص إلى صورة يقدم أداءً أفضل من Dalle-2 و Stable Diffusion، وهما من أشهر نماذج تحويل النص إلى صورة المتاحة حاليًا. تم تصميم النموذج الجديد وتدريبه من قبل فريق من الباحثين من بايدو ، وكانت النتائج مذهلة.

يتفوق نموذج تحويل النص إلى صورة ERNIE-ViLG 2.0 الجديد على أداء Dalle-2 و Stable Diffusion
الصورة التي تم إنشاؤها بواسطة ERNIE-ViLG 2.0

أظهرت النتائج أن ERNIE-ViLG 2.0 تفوق بشكل كبير على أداء Dalle-2 و Stable Diffusion. يعد هذا إنجازًا مهمًا ويظهر قوة إطار عمل ERNIE. ال Metaverse Post قارن الفريق ERNIE-ViLG 2.0 مع Stable Diffusion أدناه:

ERNIE-ViLG 2.0 تحديث
Stable Diffusion
ERNIE-ViLG 2.0 تحديث
Stable Diffusion
ERNIE-ViLG 2.0 تحديث
Stable Diffusion
ERNIE-ViLG 2.0 تحديث
Stable Diffusion
ERNIE-ViLG 2.0 تحديث

توفر هذه النتائج دعمًا قويًا للفرضية القائلة بأن ERNIE-ViLG 2.0 أكثر فعالية نظام تحويل النص إلى صورة من Dalle-2 و Stable Diffusion.

هندسة Unet من Stable Diffusion تؤخذ كأساس ، ولكن مع التغييرات:

  • مزيج من خبراء تقليل الضوضاء: هناك 10 شبكات عصبية بدلاً من شبكة واحدة ، كل منها مسؤول فقط عن خطوات انتشار معينة.
  • المعرفة النصية: أعاد وزن الكلمات الموجودة في الاستعلام تلقائيًا بحيث تزداد أهمية الكلمات الرئيسية.
  • المعرفة البصرية: أثناء التدريب ، تم اكتشاف الأجسام في نتائج التوليد الوسيطة ، وزاد وزن وظيفة الخسارة في المناطق التي بها أشياء.

نتيجة لذلك ، أكبر في العالم نموذج نص إلى صورة خرج مع 24 مليار معلمة (10 مرات أكبر من SD) لتدريب النموذج.

بالمقارنة مع النماذج السابقة، فإن ERNIE-ViLG 2.0 يتفوق عليها بشكل كبير من حيث جودة الصورة ومطابقة الصورة مع النص عند اختباره في وقت واحد على ViLG-300 ثنائي اللغة موجه وضعها شخص.

تتم ترجمة الموجهات ببساطة من الصينية إلى الإنجليزية تلقائيًا في تعانق الوجه عرض عام قبل إرساله إلى منظمة العفو الدولية. الكثير من الميزات تتدفق من هذا.

  • إرني لا يعرف الشخصيات العامة الدولية. على سبيل المثال ، لا يعرف إيرني أرنولد شوارزنيجر. لديها بالتأكيد المفضلة المحلية في الصين.
  • ونتيجة لذلك، فإن طريقة استخدام أسماء المشاهير تؤدي إلى تعزيز جودة المحتوى بشكل كبير وجوه فشل.
  • يمكنك أن تتوقع بعض التشويه بسبب الترجمة من الصينية ، لذلك قد تكون هناك بعض المفاجآت في المتجر لك إذا كنت لا تتحدث الصينية.
  • إنه لا يعرف حتى أي شيء عن جريج روتكوفسكي.

اقرأ المقالات ذات الصلة:

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

المزيد من المقالات
دامير يالالوف
دامير يالالوف

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

Hot Stories
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

تنمو الشهية المؤسسية تجاه صناديق الاستثمار المتداولة في البيتكوين وسط التقلبات

تكشف الإفصاحات من خلال ملفات 13F عن مستثمرين مؤسسيين بارزين يشتغلون بصناديق الاستثمار المتداولة في البيتكوين، مما يؤكد القبول المتزايد لـ ...

أعرف المزيد

وصول يوم النطق بالحكم: مصير تشيكوسلوفاكيا معلق في الميزان بينما تنظر المحكمة الأمريكية في التماس وزارة العدل

ومن المقرر أن يواجه Changpeng Zhao الحكم في محكمة أمريكية في سياتل اليوم.

أعرف المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
تبدأ شبكة Linea من الطبقة الثانية المطالبة برمز ZERO الخاص بـ ZeroLend Airdrop المستخدمين والمستثمرين
الأسواق تقرير الأخبار تكنولوجيا
تبدأ شبكة Linea من الطبقة الثانية المطالبة برمز ZERO الخاص بـ ZeroLend Airdrop المستخدمين والمستثمرين
6 مايو 2024
Binance ستتوقف عن دعم منتجات وخدمات BIDR، وتنصح المستخدمين بتحويل الأموال قبل 20 أغسطس
الأسواق تقرير الأخبار تكنولوجيا
Binance ستتوقف عن دعم منتجات وخدمات BIDR، وتنصح المستخدمين بتحويل الأموال قبل 20 أغسطس
6 مايو 2024
خرق أمني يصيب GNUS.AI التابع لشركة Fantom Ecosystem، مما يؤدي إلى خسارة 1.27 مليون دولار
الأسواق تقرير الأخبار تكنولوجيا
خرق أمني يصيب GNUS.AI التابع لشركة Fantom Ecosystem، مما يؤدي إلى خسارة 1.27 مليون دولار
6 مايو 2024
اختراق العملات المشفرة في مايو 2024: انتصار Bitgert Coin
تقرير الأخبار
اختراق العملات المشفرة في مايو 2024: انتصار Bitgert Coin
6 مايو 2024
CRYPTOMERIA LABS PTE. المحدودة.