Stability AI" Stable Diffusion 2 الگوریتم بالاخره عمومی است: مدل depth2img جدید، ارتقاء دهنده با وضوح فوق العاده، بدون محتوای بزرگسالان
به طور خلاصه
Stable Diffusion مدل 2.0 سریعتر، منبع باز، مقیاس پذیر، قوی تر از مدل قبلی است
Stable Diffusion با ویژگی های جدید برای رندر زمان واقعی، GPU آماده می شود
هدایت عمقی stable diffusion مدل - تصویر به تصویر با ایده های جدید برای برنامه های خلاقانه
Stability AI است منتشر شد مقاله جدیدی در وبلاگ خود در مورد Stable Diffusion 2. در آن، Stability AI الگوریتم جدیدی را پیشنهاد میکند که کارآمدتر و قویتر از الگوریتم قبلی است و در عین حال آن را در برابر سایر روشهای پیشرفته مقایسه میکند.
اصلی CompVis Stable Diffusion مدل V1 انقلابی ماهیت منبع باز مدل های هوش مصنوعی و صدها مدل مختلف و پیشرفت در سرتاسر دنیا تولید کرد. یکی از سریعترین صعودها به 10,000 ستاره Github را شاهد بودیم که در کمتر از دو ماه 33,000 ستاره به دست آورد، سریعتر از برنامه های بیشتر در Github.
اصلی Stable Diffusion انتشار V1 توسط تیم پویا Robin Rombach (Stability AI) و پاتریک اسر (Runway ML) از گروه CompVis در LMU مونیخ، به رهبری پروفسور دکتر Björn Ommer. آنها بر اساس کار قبلی آزمایشگاه با Latent ساخته شدند مدل های انتشار و پشتیبانی انتقادی از LAION و Eleuther AI دریافت کرد.
چه چیزی باعث Stable Diffusion v1 متفاوت از Stable Diffusion v2؟
Stable Diffusion 2.0 شامل تعدادی پیشرفت و ویژگی قابل توجه نسبت به نسخه قبلی است، بنابراین بیایید نگاهی به آنها بیندازیم.
La Stable Diffusion نسخه 2.0 دارای مدلهای قوی تبدیل متن به تصویر است که با رمزگذار متن جدید (OpenCLIP) که توسط LAION با کمک Stability AI، که به طور قابل توجهی کیفیت را افزایش می دهد تصاویر تولید شده نسبت به نسخه های قبلی V1. مدلهای متن به تصویر این نسخه میتوانند تصاویری با وضوح پیشفرض ۵۱۲×۵۱۲ پیکسل و ۷۶۸×۷۶۸ پیکسل تولید کنند.
این مدلها با استفاده از زیرمجموعه زیباییشناختی مجموعه داده LAION-5B ایجاد شده توسط آموزش داده میشوند Stability AIتیم DeepFloyd، که سپس برای حذف محتوای بزرگسالان با استفاده از فیلتر NSFW LAION فیلتر میشود.
ارزیابیها با استفاده از 50 مرحله نمونه DDIM، 50 مقیاس راهنمای بدون طبقهبندی، و 1.5، 2.0، 3.0، 4.0، 5.0، 6.0، 7.0 و 8.0 نشاندهنده بهبود نسبی نقاط بازرسی است:
Stable Diffusion 2.0 اکنون از یک مدل Upscaler Diffusion استفاده می کند که وضوح تصویر را تا XNUMX برابر افزایش می دهد. نمونه ای از مدل ما upscaling یک تصویر تولید شده با کیفیت پایین (128×128) به یک تصویر با وضوح بالاتر در زیر نشان داده شده است (512×512). Stable Diffusion 2.0، هنگامی که با مدل های متن به تصویر ما ترکیب می شود، اکنون می تواند تصاویری با وضوح 2048×2048 یا بالاتر تولید کند.
جدید هدایت شده در عمق stable diffusion مدل، depth2img، ویژگی قبلی تصویر به تصویر را از V1 با امکانات خلاقانه کاملاً جدید گسترش می دهد. Depth2img عمق یک تصویر ورودی را تعیین می کند (با استفاده از مدل موجود) و سپس جدید را تولید می کند. تصاویر بر اساس متن و اطلاعات عمقی. عمق به تصویر می تواند انبوهی از برنامه های خلاقانه جدید را ارائه دهد و تغییراتی را ارائه دهد که به طور قابل توجهی با تصویر اصلی متفاوت به نظر می رسد و در عین حال انسجام و عمق تصویر را حفظ می کند.
آنچه در آن جدید است Stable Diffusion 2?
- جدید stable diffusion مدل وضوح 768×768 را ارائه می دهد.
- U-Net دارای همان مقدار پارامتر نسخه 1.5 است، اما از ابتدا آموزش داده شده است و از OpenCLIP-ViT/H به عنوان رمزگذار متن خود استفاده می کند. یک مدل به اصطلاح پیش بینی v SD 2.0-v است.
- مدل فوق از پایه SD 2.0 تنظیم شده است که همچنین در دسترس است و به عنوان یک مدل معمولی پیش بینی نویز بر روی تصاویر 512×512 آموزش داده شده است.
- یک مدل انتشار متن پنهان با مقیاس بندی x4 اضافه شده است.
- SD 2.0-base تصفیه شده با هدایت عمق stable diffusion مدل. این مدل را می توان برای حفظ ساختار img2img و سنتز شرطی شکل استفاده کرد و مشروط به تخمین عمق تک چشمی استنباط شده توسط MiDaS است.
- یک مدل نقاشی داخلی با هدایت متن بهبودیافته که بر اساس پایه SD 2.0 ساخته شده است.
توسعه دهندگان سخت کار کردند، درست مانند تکرار اولیه Stable Diffusion، برای بهینه سازی مدل برای اجرا بر روی یک GPU واحد - آنها می خواستند از همان ابتدا آن را برای افراد زیادی در دسترس قرار دهند. آنها قبلاً دیده اند که چه اتفاقی می افتد وقتی میلیون ها نفر از این مدل ها دست می گیرند و برای ساختن چیزهای کاملاً قابل توجه همکاری می کنند. این قدرت منبع باز است: بهره برداری از پتانسیل عظیم میلیون ها انسان با استعداد که ممکن است منابع لازم برای آموزش یک مدل پیشرفته را نداشته باشند، اما توانایی انجام کارهای باورنکردنی با یک مدل را دارند.
این بهروزرسانی جدید، همراه با ویژگیهای جدید قدرتمند مانند depth2img و قابلیتهای ارتقای وضوح بهتر، به عنوان پایهای برای انبوهی از برنامههای کاربردی جدید عمل میکند و امکان انفجار پتانسیل خلاقانه جدید را فراهم میکند.
بیشتر بخوانید Stable Diffusion:
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.
مقالات بیشترDamir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.