Stability AI تطلق نموذجًا جديدًا يسمى SDXL Beta
في سطور
Stability AI أصدر نموذجًا جديدًا يسمى SDXL Beta (Stable Diffusion XL بيتا). إنه نموذج أكبر مع مزيد من المعلمات وبعض التحسينات غير المعروفة. وهي متوفرة في DreamStudio ، Stability AIمنشئ الصور الرسمي ، ويستخدم خوارزميات متقدمة وتقنيات التعلم العميق لإنشاء صور مذهلة.
Stability AI كشف النقاب عن معاينة لنموذج جديد يسمى SDXL Beta ، باختصار Stable Diffusion XL بيتا. حتى الآن ، لم تشارك الشركة الكثير من المعلومات حول النموذج ، لكنها متاحة للاختبار لأي شخص يريد القيام بذلك. ما الجديد في نموذج SDXL هذا لـ stable diffusion؟ ما هي مزاياها وعيوبها؟ دعنا نتحرى.
اقرأ أكثر: Midjourney و Dall-E Artist Styles Dump مع أمثلة: 130 تقنية مشهورة للرسم بالذكاء الاصطناعي |
ما هو نموذج SDXL بالضبط؟
نموذج SDXL هو نموذج جديد موجود حاليًا يجري تدريبه. إنه بعيد عن الانتهاء ، وبحلول وقت إصداره ، قد يتغير الكثير من التفاصيل حوله ؛ لكل ما نعرفه ، قد لا يسمى نموذج SDXL. كل ما نعرفه هو أنه نموذج أكبر به مزيد من المعلمات وبعض التحسينات غير المعروفة. إنه نموذج v2 وليس نموذج v3 (مهما كان معنى ذلك). من الممكن أن تؤدي التحسينات في نموذج الإصدار 2 إلى تحسين أداء النظام ، ولكن بدون مزيد من المعلومات ، من الصعب تحديد مدى أهمية هذه التحسينات. بالإضافة إلى ذلك ، سيكون من المفيد معرفة المعلمات المحددة التي تمت إضافتها أو تعديلها في هذا الإصدار.
نموذج SDXL متوفر حاليًا في DreamStudio ، Stability AIمنشئ الصور الرسمي. حدد SDXL Beta من قائمة النموذج للتحقق من ذلك. يبدو أن استخدام الخوارزميات المتقدمة و تقنيات التعلم العميق لإنشاء صور مذهلة ومثالية لمجموعة واسعة من التطبيقات.
إدخال التحسينات
نص مقروء. SDXL قادر على إنشاء نص مقروء وربما يكون أكثر ميزة ملفتة للنظر لأنه لم يكن ممكنًا في طرازي v1 و v2.1 الحاليين. نص SDXL الذي تم إنشاؤه ليس دقيقًا دائمًا كما ترى في ملف Stable Diffusion النص أدناه. ومع ذلك ، فهو أفضل بكثير من الإصدار 2.1 ، ناهيك عن طراز v1. وذلك لأن SDXLs تستخدم خوارزمية تعلم عميق أكثر تقدمًا تسمح لها بفهم وإنشاء هياكل لغوية أكثر تعقيدًا. مع مزيد من التطوير ، يمكن أن تصبح أكثر دقة وموثوقية.
علم التشريح البشري. لطالما كان التوليد الدقيق لأشكال بشرية صحيحة تشريحيًا يمثل تحديًا بالنسبة له stable diffusion. من الشائع وجود أطراف إضافية أو مفقودة. عادةً ما يتم استخدام Inpainting لإصلاحها ، أو يمكنك مؤخرًا استخدام ميزة Open Pose في ControlNet لتكرار وضع من صورة مرجعية. يسعدنا أن نلاحظ أنه هنا حيث تم تحسين نموذج SDXL Beta. أظهر نموذج SDXL Beta تحسنًا كبيرًا في تكرار الأوضاع بدقة من الصور المرجعية. يمكن أن يكون هذا أداة قيمة للعديد من التطبيقات مثل الرسوم المتحركة والواقع الافتراضي.
نمط بورتريه. ينتج SDXL Beta صورًا ممتازة تشبه الصور - إنها ترقية مقارنة بالإصدار 1.5. تعمل الخوارزمية المحسّنة في SDXL Beta على تحسين التفاصيل ودقة الألوان للصور ، مما ينتج عنه مظهر أكثر طبيعية وواقعية. يمكن للمستخدمين أيضًا ضبط مستويات الحدة والتشبع لتحقيق التأثيرات المرغوبة.
ديوتون. تنتج الكلمة الأساسية ثنائية اللون دائمًا صورًا بالأبيض والأسود في نموذج v1.5. ومع ذلك ، الآن ، تأتي الصور ثنائية اللون التي تنتجها SDXL Beta في مجموعة متنوعة من الألوان. من الواضح أنه بالمقارنة مع نماذج v1 ، فإن القدرة على تفسير الموجه تم تحسينه ، مما أدى إلى استجابات أكثر دقة وذات صلة من نماذج الإصدار 2 ، مما يجعلها أداة أكثر موثوقية لمهام معالجة اللغة الطبيعية.
الأساليب الفنية. كانت هناك بعض التعديلات الطفيفة ، ولكن من الصعب تحديد ما إذا كان النموذج الجديد يوفر نتائج أفضل لأنها ببساطة فريدة من نوعها. من الممكن أن تكون هذه التعديلات مسألة تفضيل شخصي أو رأي شخصي ، مما يجعل من الصعب إجراء ملف defiحكم أصيل على جودتها. ومع ذلك ، قد يكون تفرد التعديلات جديرًا بالملاحظة ويستحق المزيد من الاستكشاف.
وفي الختام
- Stable Diffusion يمكن أخيرًا إنتاج نص منطقي.
- يوفر SDXL صورًا أكثر إرضاءً من الناحية الجمالية من الإصدار 2.1 و (بدرجة أقل) الطرازات v1.5.
- يُنتج النموذج الجديد صورًا أكثر دقة.
- تحسن تشريح الإنسان.
- المطالبات السلبية ليست ضرورية كما في الإصدار 2.1.
- يمكنه إنشاء صور واقعية.
- سيتم إصلاح بعض الشذوذ في النموذج قبل الإصدار.
اقرأ المزيد من المقالات ذات الصلة:
إخلاء المسئولية
تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.
نبذة عن الكاتب
دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.
المزيد من المقالاتدامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.