گزارش خبری
نوامبر 06، 2022

ERNIE-ViLG 2.0: مدل جدید تبدیل متن به تصویر بایدو بهتر از Dalle-2 و Stable Diffusion

به طور خلاصه

هم Dalle-2 و هم Stable Diffusion به طور قابل توجهی از ERNIE-ViLG 2.0 بهتر عمل کردند

ERNIE-ViLG 2.0 یک مدل متن به تصویر است که عملکرد بهتری نسبت به Dalle-2 و Stable Diffusion، دو مورد از محبوب ترین مدل های متن به تصویر موجود در حال حاضر. مدل جدید توسط تیمی از محققان بایدو طراحی و آموزش داده شد و نتایج خیره کننده است.

مدل جدید تبدیل متن به تصویر ERNIE-ViLG 2.0 بهتر از Dalle-2 و Stable Diffusion
تصویر ایجاد شده توسط ERNIE-ViLG 2.0

نتایج نشان داد که ERNIE-ViLG 2.0 به طور قابل توجهی بهتر از Dalle-2 و Stable Diffusion. این یک دستاورد قابل توجه است و قدرت چارچوب ERNIE را نشان می دهد. این Metaverse Post تیم ERNIE-ViLG 2.0 را با Stable Diffusion زیر است:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

این نتایج برای این فرضیه که ERNIE-ViLG 2.0 موثرتر است، پشتیبانی قوی می‌کند سیستم متن به تصویر از هر دو Dalle-2 و Stable Diffusion.

معماری Unet از Stable Diffusion به عنوان مبنا در نظر گرفته شده است، اما با تغییرات:

  • ترکیبی از متخصصان حذف نویز: 10 شبکه عصبی به جای یک شبکه وجود دارد که هر کدام فقط مسئول مراحل انتشار خاصی هستند.
  • دانش متنی: به طور خودکار کلمات موجود در پرس و جو را مجدداً وزن کرد تا کلمات کلیدی وزن بیشتری پیدا کنند.
  • دانش بصری: در طول تمرین، اشیاء در نتایج نسل میانی شناسایی شدند و وزن تابع از دست دادن در مناطق دارای اشیا افزایش یافت.

در نتیجه، بزرگترین جهان مدل متن به تصویر با 24 میلیارد پارامتر (10 برابر بزرگتر از SD) برای آموزش مدل تولید شد.

در مقایسه با مدل‌های قبلی، ERNIE-ViLG 2.0 از نظر کیفیت تصویر و تطابق تصویر به متن در هنگام آزمایش همزمان بر روی ViLG-300 دوزبانه بسیار فراتر از آنهاست. سریع توسط یک شخص تنظیم شده است

اعلان ها به سادگی از چینی به انگلیسی به صورت خودکار در آن ترجمه می شوند صورت در آغوش گرفته نسخه ی نمایشی عمومی قبل از ارسال به هوش مصنوعی. بسیاری از ویژگی ها از این سرچشمه می گیرند.

  • ERNIE چهره های عمومی بین المللی را نمی شناسد. به عنوان مثال، ERNIE آرنولد شوارتزنگر را نمی شناسد. مطمئناً موارد مورد علاقه محلی در چین را دارد.
  • در نتیجه، روش استفاده از نام افراد مشهور باعث افزایش چشمگیر کیفیت می شود چهره ها شکست می خورد
  • به دلیل ترجمه از زبان چینی می توانید انتظار کمی اعوجاج داشته باشید، بنابراین اگر چینی صحبت نمی کنید ممکن است شگفتی هایی در انتظار شما باشد.
  • حتی درباره گرگ روتکوفسکی چیزی نمی داند.

مقالات مرتبط را بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories

راه حل تجارت استیبل کوین چشم ملل BRICS

by ویکتوریا پالچیک
ممکن است 01، 2024
به خبرنامه ما بپیوندید.
آخرین اخبار

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید

بنیانگذاران کیف پول سامورایی متهم به تسهیل 2 میلیارد دلار در معاملات Darknet شدند

دلهره از بنیانگذاران کیف پول سامورای نشان دهنده یک شکست قابل توجه برای صنعت است که تاکیدی بر ادامه دار بودن ...

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
Ankr با پلتفرم بلاک چین هوش مصنوعی شبکه Talus برای باز کردن نقدینگی بیت کوین برای هوش مصنوعی همکاری می کند
کسب و کار گزارش خبری پیشرفته
Ankr با پلتفرم بلاک چین هوش مصنوعی شبکه Talus برای باز کردن نقدینگی بیت کوین برای هوش مصنوعی همکاری می کند
ممکن است 1، 2024
Binance Labs از Movement Labs برای تسهیل ادغام حرکت فیس بوک در میان بلاک چین ها پشتیبانی می کند.
کسب و کار گزارش خبری پیشرفته
Binance Labs از Movement Labs برای تسهیل ادغام حرکت فیس بوک در میان بلاک چین ها پشتیبانی می کند.
ممکن است 1، 2024
راه حل تجارت استیبل کوین چشم ملل BRICS
کسب و کار بازارها داستان ها و نقدها پیشرفته
راه حل تجارت استیبل کوین چشم ملل BRICS
ممکن است 1، 2024
BOB شبکه بیت کوین L2 با لایه صفر برای کارکردهای پیشرفته ادغام می شود
کسب و کار گزارش خبری پیشرفته
BOB شبکه بیت کوین L2 با لایه صفر برای کارکردهای پیشرفته ادغام می شود
ممکن است 1، 2024
CRYPTOMERIA LABS PTE. محدود