گزارش خبری
نوامبر 06، 2022

ERNIE-ViLG 2.0: مدل جدید تبدیل متن به تصویر بایدو بهتر از Dalle-2 و Stable Diffusion

به طور خلاصه

هم Dalle-2 و هم Stable Diffusion به طور قابل توجهی از ERNIE-ViLG 2.0 بهتر عمل کردند

ERNIE-ViLG 2.0 یک مدل متن به تصویر است که عملکرد بهتری نسبت به Dalle-2 و Stable Diffusion، دو مورد از محبوب ترین مدل های متن به تصویر موجود در حال حاضر. مدل جدید توسط تیمی از محققان بایدو طراحی و آموزش داده شد و نتایج خیره کننده است.

مدل جدید تبدیل متن به تصویر ERNIE-ViLG 2.0 بهتر از Dalle-2 و Stable Diffusion
تصویر ایجاد شده توسط ERNIE-ViLG 2.0

نتایج نشان داد که ERNIE-ViLG 2.0 به طور قابل توجهی بهتر از Dalle-2 و Stable Diffusion. این یک دستاورد قابل توجه است و قدرت چارچوب ERNIE را نشان می دهد. این Metaverse Post تیم ERNIE-ViLG 2.0 را با Stable Diffusion زیر است:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

این نتایج برای این فرضیه که ERNIE-ViLG 2.0 موثرتر است، پشتیبانی قوی می‌کند سیستم متن به تصویر از هر دو Dalle-2 و Stable Diffusion.

معماری Unet از Stable Diffusion به عنوان مبنا در نظر گرفته شده است، اما با تغییرات:

  • ترکیبی از متخصصان حذف نویز: 10 شبکه عصبی به جای یک شبکه وجود دارد که هر کدام فقط مسئول مراحل انتشار خاصی هستند.
  • دانش متنی: به طور خودکار کلمات موجود در پرس و جو را مجدداً وزن کرد تا کلمات کلیدی وزن بیشتری پیدا کنند.
  • دانش بصری: در طول تمرین، اشیاء در نتایج نسل میانی شناسایی شدند و وزن تابع از دست دادن در مناطق دارای اشیا افزایش یافت.

در نتیجه، بزرگترین جهان مدل متن به تصویر با 24 میلیارد پارامتر (10 برابر بزرگتر از SD) برای آموزش مدل تولید شد.

در مقایسه با مدل‌های قبلی، ERNIE-ViLG 2.0 از نظر کیفیت تصویر و تطابق تصویر به متن در هنگام آزمایش همزمان بر روی ViLG-300 دوزبانه بسیار فراتر از آنهاست. سریع توسط یک شخص تنظیم شده است

اعلان ها به سادگی از چینی به انگلیسی به صورت خودکار در آن ترجمه می شوند صورت در آغوش گرفته نسخه ی نمایشی عمومی قبل از ارسال به هوش مصنوعی. بسیاری از ویژگی ها از این سرچشمه می گیرند.

  • ERNIE چهره های عمومی بین المللی را نمی شناسد. به عنوان مثال، ERNIE آرنولد شوارتزنگر را نمی شناسد. مطمئناً موارد مورد علاقه محلی در چین را دارد.
  • در نتیجه، روش استفاده از نام افراد مشهور باعث افزایش چشمگیر کیفیت می شود چهره ها شکست می خورد
  • به دلیل ترجمه از زبان چینی می توانید انتظار کمی اعوجاج داشته باشید، بنابراین اگر چینی صحبت نمی کنید ممکن است شگفتی هایی در انتظار شما باشد.
  • حتی درباره گرگ روتکوفسکی چیزی نمی داند.

مقالات مرتبط را بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

در میان نوسانات، اشتهای سازمانی به سمت ETF های بیت کوین رشد می کند

افشاگری از طریق پرونده های 13F نشان می دهد که سرمایه گذاران نهادی قابل توجهی در ETF های بیت کوین مشغول هستند و بر پذیرش فزاینده ...

بیشتر بدانید

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
Injective با AltLayer نیروها را به هم می پیوندد تا امنیت مجدد را به inEVM بیاورد
کسب و کار گزارش خبری پیشرفته
Injective با AltLayer نیروها را به هم می پیوندد تا امنیت مجدد را به inEVM بیاورد
ممکن است 3، 2024
Masa با Teller همکاری می کند تا استخر وام MASA را معرفی کند، وام USDC را بر اساس امکان پذیر می کند
بازارها گزارش خبری پیشرفته
Masa با Teller همکاری می کند تا استخر وام MASA را معرفی کند، وام USDC را بر اساس امکان پذیر می کند
ممکن است 3، 2024
Velodrome نسخه بتا سوپرچین را در هفته‌های آینده عرضه می‌کند و در سراسر بلاک‌چین‌های OP Stack Layer 2 گسترش می‌یابد
بازارها گزارش خبری پیشرفته
Velodrome نسخه بتا سوپرچین را در هفته‌های آینده عرضه می‌کند و در سراسر بلاک‌چین‌های OP Stack Layer 2 گسترش می‌یابد
ممکن است 3، 2024
CARV شراکت با Aethir را برای تمرکززدایی لایه داده خود و توزیع جوایز اعلام می کند.
کسب و کار گزارش خبری پیشرفته
CARV شراکت با Aethir را برای تمرکززدایی لایه داده خود و توزیع جوایز اعلام می کند.
ممکن است 3، 2024
CRYPTOMERIA LABS PTE. محدود