گزارش خبری
نوامبر 06، 2022

ERNIE-ViLG 2.0: مدل جدید تبدیل متن به تصویر بایدو بهتر از Dalle-2 و Stable Diffusion

به طور خلاصه

هم Dalle-2 و هم Stable Diffusion به طور قابل توجهی از ERNIE-ViLG 2.0 بهتر عمل کردند

ERNIE-ViLG 2.0 یک مدل متن به تصویر است که عملکرد بهتری نسبت به Dalle-2 و Stable Diffusion، دو مورد از محبوب ترین مدل های متن به تصویر موجود در حال حاضر. مدل جدید توسط تیمی از محققان بایدو طراحی و آموزش داده شد و نتایج خیره کننده است.

مدل جدید تبدیل متن به تصویر ERNIE-ViLG 2.0 بهتر از Dalle-2 و Stable Diffusion
تصویر ایجاد شده توسط ERNIE-ViLG 2.0

نتایج نشان داد که ERNIE-ViLG 2.0 به طور قابل توجهی بهتر از Dalle-2 و Stable Diffusion. این یک دستاورد قابل توجه است و قدرت چارچوب ERNIE را نشان می دهد. این Metaverse Post تیم ERNIE-ViLG 2.0 را با Stable Diffusion زیر است:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

این نتایج برای این فرضیه که ERNIE-ViLG 2.0 موثرتر است، پشتیبانی قوی می‌کند سیستم متن به تصویر از هر دو Dalle-2 و Stable Diffusion.

معماری Unet از Stable Diffusion به عنوان مبنا در نظر گرفته شده است، اما با تغییرات:

  • ترکیبی از متخصصان حذف نویز: 10 شبکه عصبی به جای یک شبکه وجود دارد که هر کدام فقط مسئول مراحل انتشار خاصی هستند.
  • دانش متنی: به طور خودکار کلمات موجود در پرس و جو را مجدداً وزن کرد تا کلمات کلیدی وزن بیشتری پیدا کنند.
  • دانش بصری: در طول تمرین، اشیاء در نتایج نسل میانی شناسایی شدند و وزن تابع از دست دادن در مناطق دارای اشیا افزایش یافت.

در نتیجه، بزرگترین جهان مدل متن به تصویر با 24 میلیارد پارامتر (10 برابر بزرگتر از SD) برای آموزش مدل تولید شد.

در مقایسه با مدل‌های قبلی، ERNIE-ViLG 2.0 از نظر کیفیت تصویر و تطابق تصویر به متن در هنگام آزمایش همزمان بر روی ViLG-300 دوزبانه بسیار فراتر از آنهاست. سریع توسط یک شخص تنظیم شده است

اعلان ها به سادگی از چینی به انگلیسی به صورت خودکار در آن ترجمه می شوند صورت در آغوش گرفته نسخه ی نمایشی عمومی قبل از ارسال به هوش مصنوعی. بسیاری از ویژگی ها از این سرچشمه می گیرند.

  • ERNIE چهره های عمومی بین المللی را نمی شناسد. به عنوان مثال، ERNIE آرنولد شوارتزنگر را نمی شناسد. مطمئناً موارد مورد علاقه محلی در چین را دارد.
  • در نتیجه، روش استفاده از نام افراد مشهور باعث افزایش چشمگیر کیفیت می شود چهره ها شکست می خورد
  • به دلیل ترجمه از زبان چینی می توانید انتظار کمی اعوجاج داشته باشید، بنابراین اگر چینی صحبت نمی کنید ممکن است شگفتی هایی در انتظار شما باشد.
  • حتی درباره گرگ روتکوفسکی چیزی نمی داند.

مقالات مرتبط را بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

پیشرفت رمزنگاری مه 2024: پیروزی بیتگرت کوین

by گریگوری پودوفسکی
ممکن است 06، 2024

در میان نوسانات، اشتهای سازمانی به سمت ETF های بیت کوین رشد می کند

افشاگری از طریق پرونده های 13F نشان می دهد که سرمایه گذاران نهادی قابل توجهی در ETF های بیت کوین مشغول هستند و بر پذیرش فزاینده ...

بیشتر بدانید

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
Layer 2 Network Linea درخواست ZERO Token's ZeroLend را آغاز می کند Airdrop کاربران و سرمایه گذاران
بازارها گزارش خبری پیشرفته
Layer 2 Network Linea درخواست ZERO Token's ZeroLend را آغاز می کند Airdrop کاربران و سرمایه گذاران
ممکن است 6، 2024
بایننس برای توقف پشتیبانی از محصولات و خدمات BIDR، به کاربران توصیه می کند تا قبل از 20 آگوست وجوه خود را تبدیل کنند.
بازارها گزارش خبری پیشرفته
بایننس برای توقف پشتیبانی از محصولات و خدمات BIDR، به کاربران توصیه می کند تا قبل از 20 آگوست وجوه خود را تبدیل کنند.
ممکن است 6، 2024
نقض امنیتی به GNUS.AI اکوسیستم Fantom برخورد کرد و منجر به ضرر 1.27 میلیون دلاری شد
بازارها گزارش خبری پیشرفته
نقض امنیتی به GNUS.AI اکوسیستم Fantom برخورد کرد و منجر به ضرر 1.27 میلیون دلاری شد
ممکن است 6، 2024
پیشرفت رمزنگاری مه 2024: پیروزی بیتگرت کوین
گزارش خبری
پیشرفت رمزنگاری مه 2024: پیروزی بیتگرت کوین
ممکن است 6، 2024
CRYPTOMERIA LABS PTE. محدود