تقرير الأخبار
06 نوفمبر، 2022

ERNIE-ViLG 2.0: يتفوق نموذج تحويل النص إلى صورة الجديد من Baidu على Dalle-2 و Stable Diffusion

في سطور

كل من Dalle-2 و Stable Diffusion تم تفوق أداء ERNIE-ViLG 2.0 بشكل ملحوظ

ERNIE-ViLG 2.0 تحديث هو نموذج نص إلى صورة يقدم أداءً أفضل من Dalle-2 و Stable Diffusion، وهما من أشهر نماذج تحويل النص إلى صورة المتاحة حاليًا. تم تصميم النموذج الجديد وتدريبه من قبل فريق من الباحثين من بايدو ، وكانت النتائج مذهلة.

يتفوق نموذج تحويل النص إلى صورة ERNIE-ViLG 2.0 الجديد على أداء Dalle-2 و Stable Diffusion
الصورة التي تم إنشاؤها بواسطة ERNIE-ViLG 2.0

أظهرت النتائج أن ERNIE-ViLG 2.0 تفوق بشكل كبير على أداء Dalle-2 و Stable Diffusion. يعد هذا إنجازًا مهمًا ويظهر قوة إطار عمل ERNIE. ال Metaverse Post قارن الفريق ERNIE-ViLG 2.0 مع Stable Diffusion أدناه:

ERNIE-ViLG 2.0 تحديث
Stable Diffusion
ERNIE-ViLG 2.0 تحديث
Stable Diffusion
ERNIE-ViLG 2.0 تحديث
Stable Diffusion
ERNIE-ViLG 2.0 تحديث
Stable Diffusion
ERNIE-ViLG 2.0 تحديث

توفر هذه النتائج دعمًا قويًا للفرضية القائلة بأن ERNIE-ViLG 2.0 أكثر فعالية نظام تحويل النص إلى صورة من Dalle-2 و Stable Diffusion.

هندسة Unet من Stable Diffusion تؤخذ كأساس ، ولكن مع التغييرات:

  • مزيج من خبراء تقليل الضوضاء: هناك 10 شبكات عصبية بدلاً من شبكة واحدة ، كل منها مسؤول فقط عن خطوات انتشار معينة.
  • المعرفة النصية: أعاد وزن الكلمات الموجودة في الاستعلام تلقائيًا بحيث تزداد أهمية الكلمات الرئيسية.
  • المعرفة البصرية: أثناء التدريب ، تم اكتشاف الأجسام في نتائج التوليد الوسيطة ، وزاد وزن وظيفة الخسارة في المناطق التي بها أشياء.

نتيجة لذلك ، أكبر في العالم نموذج نص إلى صورة خرج مع 24 مليار معلمة (10 مرات أكبر من SD) لتدريب النموذج.

بالمقارنة مع النماذج السابقة، فإن ERNIE-ViLG 2.0 يتفوق عليها بشكل كبير من حيث جودة الصورة ومطابقة الصورة مع النص عند اختباره في وقت واحد على ViLG-300 ثنائي اللغة موجه وضعها شخص.

تتم ترجمة الموجهات ببساطة من الصينية إلى الإنجليزية تلقائيًا في تعانق الوجه عرض عام قبل إرساله إلى منظمة العفو الدولية. الكثير من الميزات تتدفق من هذا.

  • إرني لا يعرف الشخصيات العامة الدولية. على سبيل المثال ، لا يعرف إيرني أرنولد شوارزنيجر. لديها بالتأكيد المفضلة المحلية في الصين.
  • ونتيجة لذلك، فإن طريقة استخدام أسماء المشاهير تؤدي إلى تعزيز جودة المحتوى بشكل كبير وجوه فشل.
  • يمكنك أن تتوقع بعض التشويه بسبب الترجمة من الصينية ، لذلك قد تكون هناك بعض المفاجآت في المتجر لك إذا كنت لا تتحدث الصينية.
  • إنه لا يعرف حتى أي شيء عن جريج روتكوفسكي.

اقرأ المقالات ذات الصلة:

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

المزيد من المقالات
دامير يالالوف
دامير يالالوف

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

Hot Stories
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

وصول يوم النطق بالحكم: مصير تشيكوسلوفاكيا معلق في الميزان بينما تنظر المحكمة الأمريكية في التماس وزارة العدل

ومن المقرر أن يواجه Changpeng Zhao الحكم في محكمة أمريكية في سياتل اليوم.

أعرف المزيد

مؤسسو Samourai Wallet متهمون بتسهيل صفقات بقيمة 2 مليار دولار في Darknet

يمثل إلقاء القبض على مؤسسي Samourai Wallet انتكاسة ملحوظة لهذه الصناعة، مما يؤكد استمرار ...

أعرف المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
تتعاون Ankr مع منصة Talus لمنصة AI Blockchain لفتح سيولة Bitcoin للذكاء الاصطناعي
باقة الأعمال تقرير الأخبار تكنولوجيا
تتعاون Ankr مع منصة Talus لمنصة AI Blockchain لفتح سيولة Bitcoin للذكاء الاصطناعي
1 مايو 2024
تدعم Binance Labs مختبرات الحركة لتسهيل تكامل نقل Facebook عبر Blockchains
باقة الأعمال تقرير الأخبار تكنولوجيا
تدعم Binance Labs مختبرات الحركة لتسهيل تكامل نقل Facebook عبر Blockchains
1 مايو 2024
دول البريكس تتطلع إلى حل تجارة العملات المستقرة
باقة الأعمال الأسواق قصص ومراجعات تكنولوجيا
دول البريكس تتطلع إلى حل تجارة العملات المستقرة
1 مايو 2024
تتكامل شبكة Bitcoin L2 BOB مع LayerZero لتعزيز الوظائف
باقة الأعمال تقرير الأخبار تكنولوجيا
تتكامل شبكة Bitcoin L2 BOB مع LayerZero لتعزيز الوظائف
1 مايو 2024
CRYPTOMERIA LABS PTE. المحدودة.