گزارش خبری پیشرفته
نوامبر 24، 2022

Stability AI" Stable Diffusion 2 الگوریتم بالاخره عمومی است: مدل depth2img جدید، ارتقاء دهنده با وضوح فوق العاده، بدون محتوای بزرگسالان

به طور خلاصه

Stable Diffusion مدل 2.0 سریعتر، منبع باز، مقیاس پذیر، قوی تر از مدل قبلی است

Stable Diffusion با ویژگی های جدید برای رندر زمان واقعی، GPU آماده می شود

هدایت عمقی stable diffusion مدل - تصویر به تصویر با ایده های جدید برای برنامه های خلاقانه

Stability AI است منتشر شد مقاله جدیدی در وبلاگ خود در مورد Stable Diffusion 2. در آن، Stability AI الگوریتم جدیدی را پیشنهاد می‌کند که کارآمدتر و قوی‌تر از الگوریتم قبلی است و در عین حال آن را در برابر سایر روش‌های پیشرفته مقایسه می‌کند.

هوش مصنوعی را باز کنید Stable Diffusion 2 الگوریتم بالاخره عمومی است: مدل depth2img جدید، ارتقاء دهنده با وضوح فوق العاده، بدون محتوای بزرگسالان

اصلی CompVis Stable Diffusion مدل V1 انقلابی ماهیت منبع باز مدل های هوش مصنوعی و صدها مدل مختلف و پیشرفت در سرتاسر دنیا تولید کرد. یکی از سریعترین صعودها به 10,000 ستاره Github را شاهد بودیم که در کمتر از دو ماه 33,000 ستاره به دست آورد، سریعتر از برنامه های بیشتر در Github.

اصلی Stable Diffusion انتشار V1 توسط تیم پویا Robin Rombach (Stability AI) و پاتریک اسر (Runway ML) از گروه CompVis در LMU مونیخ، به رهبری پروفسور دکتر Björn Ommer. آنها بر اساس کار قبلی آزمایشگاه با Latent ساخته شدند مدل های انتشار و پشتیبانی انتقادی از LAION و Eleuther AI دریافت کرد.

هوش مصنوعی را باز کنید Stable Diffusion 2 الگوریتم بالاخره عمومی است: مدل depth2img جدید، ارتقاء دهنده با وضوح فوق العاده، بدون محتوای بزرگسالان
هوش مصنوعی را باز کنید Stable Diffusion 2 الگوریتم بالاخره عمومی است: مدل depth2img جدید، ارتقاء دهنده با وضوح فوق العاده، بدون محتوای بزرگسالان

چه چیزی باعث Stable Diffusion v1 متفاوت از Stable Diffusion v2؟ 

Stable Diffusion 2.0 شامل تعدادی پیشرفت و ویژگی قابل توجه نسبت به نسخه قبلی است، بنابراین بیایید نگاهی به آنها بیندازیم.

La Stable Diffusion نسخه 2.0 دارای مدل‌های قوی تبدیل متن به تصویر است که با رمزگذار متن جدید (OpenCLIP) که توسط LAION با کمک Stability AI، که به طور قابل توجهی کیفیت را افزایش می دهد تصاویر تولید شده نسبت به نسخه های قبلی V1. مدل‌های متن به تصویر این نسخه می‌توانند تصاویری با وضوح پیش‌فرض ۵۱۲×۵۱۲ پیکسل و ۷۶۸×۷۶۸ پیکسل تولید کنند.

این مدل‌ها با استفاده از زیرمجموعه زیبایی‌شناختی مجموعه داده LAION-5B ایجاد شده توسط آموزش داده می‌شوند Stability AIتیم DeepFloyd، که سپس برای حذف محتوای بزرگسالان با استفاده از فیلتر NSFW LAION فیلتر می‌شود.

ارزیابی‌ها با استفاده از 50 مرحله نمونه DDIM، 50 مقیاس راهنمای بدون طبقه‌بندی، و 1.5، 2.0، 3.0، 4.0، 5.0، 6.0، 7.0 و 8.0 نشان‌دهنده بهبود نسبی نقاط بازرسی است:

چه چیزی باعث Stable Diffusion v1 متفاوت از Stable Diffusion v2؟

Stable Diffusion 2.0 اکنون از یک مدل Upscaler Diffusion استفاده می کند که وضوح تصویر را تا XNUMX برابر افزایش می دهد. نمونه ای از مدل ما upscaling یک تصویر تولید شده با کیفیت پایین (128×128) به یک تصویر با وضوح بالاتر در زیر نشان داده شده است (512×512). Stable Diffusion 2.0، هنگامی که با مدل های متن به تصویر ما ترکیب می شود، اکنون می تواند تصاویری با وضوح 2048×2048 یا بالاتر تولید کند.

جدید هدایت شده در عمق stable diffusion مدل، depth2img، ویژگی قبلی تصویر به تصویر را از V1 با امکانات خلاقانه کاملاً جدید گسترش می دهد. Depth2img عمق یک تصویر ورودی را تعیین می کند (با استفاده از مدل موجود) و سپس جدید را تولید می کند. تصاویر بر اساس متن و اطلاعات عمقی. عمق به تصویر می تواند انبوهی از برنامه های خلاقانه جدید را ارائه دهد و تغییراتی را ارائه دهد که به طور قابل توجهی با تصویر اصلی متفاوت به نظر می رسد و در عین حال انسجام و عمق تصویر را حفظ می کند.

آنچه در آن جدید است Stable Diffusion 2?

  • جدید stable diffusion مدل وضوح 768×768 را ارائه می دهد.
  • U-Net دارای همان مقدار پارامتر نسخه 1.5 است، اما از ابتدا آموزش داده شده است و از OpenCLIP-ViT/H به عنوان رمزگذار متن خود استفاده می کند. یک مدل به اصطلاح پیش بینی v SD 2.0-v است.
  • مدل فوق از پایه SD 2.0 تنظیم شده است که همچنین در دسترس است و به عنوان یک مدل معمولی پیش بینی نویز بر روی تصاویر 512×512 آموزش داده شده است.
  • یک مدل انتشار متن پنهان با مقیاس بندی x4 اضافه شده است.
  • SD 2.0-base تصفیه شده با هدایت عمق stable diffusion مدل. این مدل را می توان برای حفظ ساختار img2img و سنتز شرطی شکل استفاده کرد و مشروط به تخمین عمق تک چشمی استنباط شده توسط MiDaS است.
  • یک مدل نقاشی داخلی با هدایت متن بهبودیافته که بر اساس پایه SD 2.0 ساخته شده است.

توسعه دهندگان سخت کار کردند، درست مانند تکرار اولیه Stable Diffusion، برای بهینه سازی مدل برای اجرا بر روی یک GPU واحد - آنها می خواستند از همان ابتدا آن را برای افراد زیادی در دسترس قرار دهند. آنها قبلاً دیده اند که چه اتفاقی می افتد وقتی میلیون ها نفر از این مدل ها دست می گیرند و برای ساختن چیزهای کاملاً قابل توجه همکاری می کنند. این قدرت منبع باز است: بهره برداری از پتانسیل عظیم میلیون ها انسان با استعداد که ممکن است منابع لازم برای آموزش یک مدل پیشرفته را نداشته باشند، اما توانایی انجام کارهای باورنکردنی با یک مدل را دارند.

آنچه در آن جدید است Stable Diffusion 2?

این به‌روزرسانی جدید، همراه با ویژگی‌های جدید قدرتمند مانند depth2img و قابلیت‌های ارتقای وضوح بهتر، به عنوان پایه‌ای برای انبوهی از برنامه‌های کاربردی جدید عمل می‌کند و امکان انفجار پتانسیل خلاقانه جدید را فراهم می‌کند.

بیشتر بخوانید Stable Diffusion:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

در میان نوسانات، اشتهای سازمانی به سمت ETF های بیت کوین رشد می کند

افشاگری از طریق پرونده های 13F نشان می دهد که سرمایه گذاران نهادی قابل توجهی در ETF های بیت کوین مشغول هستند و بر پذیرش فزاینده ...

بیشتر بدانید

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
Injective با AltLayer نیروها را به هم می پیوندد تا امنیت مجدد را به inEVM بیاورد
کسب و کار گزارش خبری پیشرفته
Injective با AltLayer نیروها را به هم می پیوندد تا امنیت مجدد را به inEVM بیاورد
ممکن است 3، 2024
Masa با Teller همکاری می کند تا استخر وام MASA را معرفی کند، وام USDC را بر اساس امکان پذیر می کند
بازارها گزارش خبری پیشرفته
Masa با Teller همکاری می کند تا استخر وام MASA را معرفی کند، وام USDC را بر اساس امکان پذیر می کند
ممکن است 3، 2024
Velodrome نسخه بتا سوپرچین را در هفته‌های آینده عرضه می‌کند و در سراسر بلاک‌چین‌های OP Stack Layer 2 گسترش می‌یابد
بازارها گزارش خبری پیشرفته
Velodrome نسخه بتا سوپرچین را در هفته‌های آینده عرضه می‌کند و در سراسر بلاک‌چین‌های OP Stack Layer 2 گسترش می‌یابد
ممکن است 3، 2024
CARV شراکت با Aethir را برای تمرکززدایی لایه داده خود و توزیع جوایز اعلام می کند.
کسب و کار گزارش خبری پیشرفته
CARV شراکت با Aethir را برای تمرکززدایی لایه داده خود و توزیع جوایز اعلام می کند.
ممکن است 3، 2024
CRYPTOMERIA LABS PTE. محدود