تقرير الأخبار تكنولوجيا
24 نوفمبر، 2022

Stability AIالصورة Stable Diffusion 2 الخوارزمية أصبحت عامة أخيرًا: نموذج عمق 2img جديد ، مقياس دقة فائقة ، لا يوجد محتوى للبالغين

في سطور

Stable Diffusion 2.0 هو أسرع ، ومفتوح المصدر ، وقابل للتطوير ، وأكثر قوة من سابقه

Stable Diffusion تصبح جاهزة لوحدة معالجة الرسومات مع ميزات جديدة للعرض في الوقت الفعلي

عمق موجه stable diffusion نموذج - صورة إلى صورة مع أفكار جديدة للتطبيقات الإبداعية

Stability AI لديها صدر ورقة جديدة على مدونتها حول Stable Diffusion 2. فيه ، Stability AI يقترح خوارزمية جديدة أكثر كفاءة وقوة من السابقة أثناء قياسها مقارنة بأحدث الأساليب الأخرى.

افتح AI Stable Diffusion 2 الخوارزمية أصبحت عامة أخيرًا: نموذج عمق 2img جديد ، مقياس دقة فائقة ، لا يوجد محتوى للبالغين

الأصل CompVis Stable Diffusion نموذج V1 ثورة طبيعة المصدر المفتوح نماذج الذكاء الاصطناعى وأنتج مئات النماذج والتطورات المختلفة حول العالم. لقد شهدت واحدة من أسرع الصعود إلى 10,000 نجم جيثب ، حيث وصلت إلى 33,000 نجم في أقل من شهرين ، أسرع من أكثر من البرامج على جيثب.

الأصلي Stable Diffusion تمت قيادة إصدار V1 بواسطة الفريق الديناميكي لـ Robin Rombach (Stability AI) وباتريك إيسر (Runway ML) من CompVis Group في LMU Munich ، بقيادة الأستاذ الدكتور بيورن أومير. لقد بنوا على العمل السابق للمختبر مع لاتنت نماذج الانتشار وتلقى دعمًا حاسمًا من LAION و Eleuther AI.

افتح AI Stable Diffusion 2 الخوارزمية أصبحت عامة أخيرًا: نموذج عمق 2img جديد ، مقياس دقة فائقة ، لا يوجد محتوى للبالغين
افتح AI Stable Diffusion 2 الخوارزمية أصبحت عامة أخيرًا: نموذج عمق 2img جديد ، مقياس دقة فائقة ، لا يوجد محتوى للبالغين

ما يجعل Stable Diffusion الإصدار 1 يختلف عن Stable Diffusion v2؟ 

Stable Diffusion يتضمن الإصدار 2.0 عددًا من التحسينات والميزات المهمة مقارنة بالإصدار السابق ، لذلك دعونا نلقي نظرة عليها.

• Stable Diffusion يتميز الإصدار 2.0 بنماذج قوية لتحويل النص إلى صورة مدربة باستخدام برنامج ترميز نص جديد جديد (OpenCLIP) تم تطويره بواسطة LAION بمساعدة من Stability AI، مما يعزز بشكل كبير جودة ولدت الصور على الإصدارات السابقة V1. يمكن لنماذج تحويل النص إلى صورة في هذا الإصدار إخراج الصور بدقة افتراضية تبلغ 512 × 512 بكسل و 768 × 768 بكسل.

يتم تدريب هذه النماذج باستخدام مجموعة فرعية جمالية من مجموعة بيانات LAION-5B التي تم إنشاؤها بواسطة Stability AIفريق DeepFloyd الخاص بـ DeepFloyd ، والذي يتم تصفيته بعد ذلك لاستبعاد محتوى البالغين باستخدام مرشح NSFW الخاص بـ LAION.

تشير التقييمات باستخدام 50 خطوة نموذجية لـ DDIM ، و 50 مقياسًا إرشاديًا خالٍ من المصنفات ، و 1.5 ، و 2.0 ، و 3.0 ، و 4.0 ، و 5.0 ، و 6.0 ، و 7.0 ، و 8.0 ، إلى التحسينات النسبية لنقاط التفتيش:

ما يجعل Stable Diffusion الإصدار 1 يختلف عن Stable Diffusion v2؟

Stable Diffusion يتضمن الإصدار 2.0 الآن نموذج Upscaler Diffusion، الذي يزيد من دقة الصورة بمقدار أربعة أضعاف. مثال على نموذجنا رفع مستوى يتم عرض صورة منخفضة الجودة (128 × 128) في صورة ذات دقة أعلى أدناه (512 × 512). Stable Diffusion 2.0 ، عند دمجه مع نماذج تحويل النص إلى صورة ، يمكنه الآن إنشاء صور بدقة 2048 × 2048 أو أعلى.

عمق التوجيه الجديد stable diffusion نموذج، deep2img ، يوسع ميزة الصورة إلى الصورة السابقة من V1 بإمكانيات إبداعية جديدة تمامًا. يحدد Depth2img عمق صورة الإدخال (باستخدام نموذج موجود) ثم يقوم بإنشاء صورة جديدة صور استنادًا إلى كل من النص ومعلومات العمق. يمكن أن يوفر Depth-to-Image عددًا كبيرًا من التطبيقات الإبداعية الجديدة ، مما يوفر تغييرات تبدو مختلفة بشكل كبير عن الأصل مع الاحتفاظ بتماسك الصورة وعمقها.

ما الجديد في Stable Diffusion 2?

  • الجديد stable diffusion نموذج تقدم دقة 768 × 768.
  • يحتوي U-Net على نفس المقدار من المعلمات مثل الإصدار 1.5 ، ولكن يتم تدريبه من البداية ويستخدم OpenCLIP-ViT / H كمشفّر نصوص. نموذج ما يسمى بالتنبؤ الخامس هو SD 2.0-v.
  • تم تعديل النموذج المذكور أعلاه من SD 2.0-base ، والذي تم توفيره أيضًا وتم تدريبه كنموذج نموذجي للتنبؤ بالضوضاء على صور 512 × 512.
  • تمت إضافة نموذج انتشار موجه بالنص كامن مع تحجيم x4.
  • مصقول SD 2.0 قاعدة توجيه العمق stable diffusion نموذج. يمكن استخدام النموذج في img2img للحفاظ على الهيكل والتوليف المشروط للشكل وهو مشروط بتقديرات العمق الأحادي التي يستنتجها MiDaS.
  • نموذج طلاء داخلي مُحسَّن موجه بالنص مبني على أساس SD 2.0.

عمل المطورون بجد ، تمامًا مثل التكرار الأولي لـ Stable Diffusion، لتحسين النموذج ليعمل على وحدة معالجة رسومات واحدة - أرادوا جعله في متناول أكبر عدد ممكن من الأشخاص منذ البداية. لقد رأوا بالفعل ما يحدث عندما يضع ملايين الأفراد أيديهم على هذه النماذج ويتعاونون لبناء أشياء رائعة للغاية. هذه هي قوة المصادر المفتوحة: تسخير الإمكانات الهائلة لملايين الأشخاص الموهوبين الذين قد لا يملكون الموارد لتدريب نموذج متطور ولكن لديهم القدرة على القيام بأشياء لا تصدق باستخدام واحد.

ما الجديد في Stable Diffusion 2?

هذا التحديث الجديد ، جنبًا إلى جنب مع الميزات الجديدة القوية مثل عمق 2img وإمكانيات تحسين الدقة الأفضل ، سيكون بمثابة الأساس لعدد كبير من التطبيقات الجديدة ويمكّن من انفجار إمكانات إبداعية جديدة.

مزيد من المعلومات حول Stable Diffusion:

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

المزيد من المقالات
دامير يالالوف
دامير يالالوف

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

Hot Stories

Injective تتعاون مع AltLayer لجلب الأمن إلى inEVM

by أليسا ديفيدسون
03 مايو 2024
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

Injective تتعاون مع AltLayer لجلب الأمن إلى inEVM

by أليسا ديفيدسون
03 مايو 2024

تنمو الشهية المؤسسية تجاه صناديق الاستثمار المتداولة في البيتكوين وسط التقلبات

تكشف الإفصاحات من خلال ملفات 13F عن مستثمرين مؤسسيين بارزين يشتغلون بصناديق الاستثمار المتداولة في البيتكوين، مما يؤكد القبول المتزايد لـ ...

أعرف المزيد

وصول يوم النطق بالحكم: مصير تشيكوسلوفاكيا معلق في الميزان بينما تنظر المحكمة الأمريكية في التماس وزارة العدل

ومن المقرر أن يواجه Changpeng Zhao الحكم في محكمة أمريكية في سياتل اليوم.

أعرف المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
Injective تتعاون مع AltLayer لجلب الأمن إلى inEVM
باقة الأعمال تقرير الأخبار تكنولوجيا
Injective تتعاون مع AltLayer لجلب الأمن إلى inEVM
3 مايو 2024
تتعاون Masa مع Teller لتقديم مجمع إقراض MASA، مما يتيح اقتراض USDC على القاعدة
الأسواق تقرير الأخبار تكنولوجيا
تتعاون Masa مع Teller لتقديم مجمع إقراض MASA، مما يتيح اقتراض USDC على القاعدة
3 مايو 2024
تطلق Velodrome الإصدار التجريبي من Superchain في الأسابيع القادمة وتتوسع عبر OP Stack Layer 2 Blockchains
الأسواق تقرير الأخبار تكنولوجيا
تطلق Velodrome الإصدار التجريبي من Superchain في الأسابيع القادمة وتتوسع عبر OP Stack Layer 2 Blockchains
3 مايو 2024
تعلن CARV عن شراكة مع Aethir لتحقيق اللامركزية في طبقة البيانات الخاصة بها وتوزيع المكافآت
باقة الأعمال تقرير الأخبار تكنولوجيا
تعلن CARV عن شراكة مع Aethir لتحقيق اللامركزية في طبقة البيانات الخاصة بها وتوزيع المكافآت
3 مايو 2024
CRYPTOMERIA LABS PTE. المحدودة.