تقرير الأخبار تكنولوجيا
10 نيسان

Stability AI تطلق نموذجًا جديدًا يسمى SDXL Beta

في سطور

Stability AI أصدر نموذجًا جديدًا يسمى SDXL Beta (Stable Diffusion XL بيتا). إنه نموذج أكبر مع مزيد من المعلمات وبعض التحسينات غير المعروفة. وهي متوفرة في DreamStudio ، Stability AIمنشئ الصور الرسمي ، ويستخدم خوارزميات متقدمة وتقنيات التعلم العميق لإنشاء صور مذهلة.

Stability AI كشف النقاب عن معاينة لنموذج جديد يسمى SDXL Beta ، باختصار Stable Diffusion XL بيتا. حتى الآن ، لم تشارك الشركة الكثير من المعلومات حول النموذج ، لكنها متاحة للاختبار لأي شخص يريد القيام بذلك. ما الجديد في نموذج SDXL هذا لـ stable diffusion؟ ما هي مزاياها وعيوبها؟ دعنا نتحرى.

اقرأ أكثر: Midjourney و Dall-E Artist Styles Dump مع أمثلة: 130 تقنية مشهورة للرسم بالذكاء الاصطناعي

ما هو نموذج SDXL بالضبط؟

نموذج SDXL هو نموذج جديد موجود حاليًا يجري تدريبه. إنه بعيد عن الانتهاء ، وبحلول وقت إصداره ، قد يتغير الكثير من التفاصيل حوله ؛ لكل ما نعرفه ، قد لا يسمى نموذج SDXL. كل ما نعرفه هو أنه نموذج أكبر به مزيد من المعلمات وبعض التحسينات غير المعروفة. إنه نموذج v2 وليس نموذج v3 (مهما كان معنى ذلك). من الممكن أن تؤدي التحسينات في نموذج الإصدار 2 إلى تحسين أداء النظام ، ولكن بدون مزيد من المعلومات ، من الصعب تحديد مدى أهمية هذه التحسينات. بالإضافة إلى ذلك ، سيكون من المفيد معرفة المعلمات المحددة التي تمت إضافتها أو تعديلها في هذا الإصدار.

نموذج SDXL متوفر حاليًا في DreamStudio ، Stability AIمنشئ الصور الرسمي. حدد SDXL Beta من قائمة النموذج للتحقق من ذلك. يبدو أن استخدام الخوارزميات المتقدمة و تقنيات التعلم العميق لإنشاء صور مذهلة ومثالية لمجموعة واسعة من التطبيقات.

ما هو نموذج SDXL بالضبط؟

إدخال التحسينات

نص مقروء. SDXL قادر على إنشاء نص مقروء وربما يكون أكثر ميزة ملفتة للنظر لأنه لم يكن ممكنًا في طرازي v1 و v2.1 الحاليين. نص SDXL الذي تم إنشاؤه ليس دقيقًا دائمًا كما ترى في ملف Stable Diffusion النص أدناه. ومع ذلك ، فهو أفضل بكثير من الإصدار 2.1 ، ناهيك عن طراز v1. وذلك لأن SDXLs تستخدم خوارزمية تعلم عميق أكثر تقدمًا تسمح لها بفهم وإنشاء هياكل لغوية أكثر تعقيدًا. مع مزيد من التطوير ، يمكن أن تصبح أكثر دقة وموثوقية.

موجه: صورة رجل نبيل يحمل ورقة بيضاء مكتوب عليها "غير مزيفة"
موجه: صورة رجل نبيل يحمل ورقة بيضاء مكتوب عليها "غير مزيفة"
صورة لامرأة حمراء الرأس تحمل لافتة سوداء عليها خطوط بيضاء مكتوب عليها "ممنوع الدعابات"
رسالة فورية: صورة لامرأة حمراء الرأس تحمل لافتة سوداء عليها خطوط بيضاء مكتوب عليها "ممنوع الدعابات"
موجه: صورة لامرأة صينية جالسة في السينما ممسكة بصحن مكتوب عليه كلمة "ألم وطائرة".
موجه: صورة لامرأة صينية تجلس في دار سينما وتحمل طبقًا مكتوبًا عليه كلمة "ألم وطائرة".

علم التشريح البشري. لطالما كان التوليد الدقيق لأشكال بشرية صحيحة تشريحيًا يمثل تحديًا بالنسبة له stable diffusion. من الشائع وجود أطراف إضافية أو مفقودة. عادةً ما يتم استخدام Inpainting لإصلاحها ، أو يمكنك مؤخرًا استخدام ميزة Open Pose في ControlNet لتكرار وضع من صورة مرجعية. يسعدنا أن نلاحظ أنه هنا حيث تم تحسين نموذج SDXL Beta. أظهر نموذج SDXL Beta تحسنًا كبيرًا في تكرار الأوضاع بدقة من الصور المرجعية. يمكن أن يكون هذا أداة قيمة للعديد من التطبيقات مثل الرسوم المتحركة والواقع الافتراضي.

صورة لامرأة بملابس رياضية تدور الكرة في يدها اليمنى
موجه: صورة لامرأة ترتدي زيًا رياضيًا تدير الكرة في يدها اليمنى
صورة لصبي يجلس تحت القمر الأحمر
موجه: صورة لصبي جالس تحت القمر الأحمر
موجه: تظهر صورة رجل عجوز يركض في الغابة.

نمط بورتريه. ينتج SDXL Beta صورًا ممتازة تشبه الصور - إنها ترقية مقارنة بالإصدار 1.5. تعمل الخوارزمية المحسّنة في SDXL Beta على تحسين التفاصيل ودقة الألوان للصور ، مما ينتج عنه مظهر أكثر طبيعية وواقعية. يمكن للمستخدمين أيضًا ضبط مستويات الحدة والتشبع لتحقيق التأثيرات المرغوبة.

موجه: صورة صبي وفتاة
موجه: صورة صبي وفتاة
موجه: صورة شخصية لرجل سمين
موجه: صورة شخصية لرجل سمين
موجه: لقطة صورة لامرأة من الثمانينيات
موجه: لقطة صورة لامرأة من الثمانينيات

ديوتون. تنتج الكلمة الأساسية ثنائية اللون دائمًا صورًا بالأبيض والأسود في نموذج v1.5. ومع ذلك ، الآن ، تأتي الصور ثنائية اللون التي تنتجها SDXL Beta في مجموعة متنوعة من الألوان. من الواضح أنه بالمقارنة مع نماذج v1 ، فإن القدرة على تفسير الموجه تم تحسينه ، مما أدى إلى استجابات أكثر دقة وذات صلة من نماذج الإصدار 2 ، مما يجعلها أداة أكثر موثوقية لمهام معالجة اللغة الطبيعية.

صورة ثنائية اللون للكلب
موجه: صورة نمط ثنائية اللون لكلب
المشهد الثنائي للجزيرة
موجه: منظر مزدوج للجزيرة
صورة ثنائية اللون من امرأة أفريقية شابة
موجه: صورة ثنائية اللون لامرأة أفريقية شابة

الأساليب الفنية. كانت هناك بعض التعديلات الطفيفة ، ولكن من الصعب تحديد ما إذا كان النموذج الجديد يوفر نتائج أفضل لأنها ببساطة فريدة من نوعها. من الممكن أن تكون هذه التعديلات مسألة تفضيل شخصي أو رأي شخصي ، مما يجعل من الصعب إجراء ملف defiحكم أصيل على جودتها. ومع ذلك ، قد يكون تفرد التعديلات جديرًا بالملاحظة ويستحق المزيد من الاستكشاف.

نيويورك - إيفان إيفازوفسكي
الإصدار 1.5: نيويورك بقلم إيفان إيفازوفسكي
نيويورك - إيفان إيفازوفسكي
SDXL: نيويورك بواسطة إيفان إيفازوفسكي
الغابة القديمة لكريستوفر بالاسكاس
الإصدار 1.5: Old Forest بقلم كريستوفر بالاسكاس
الغابة القديمة لكريستوفر بالاسكاس
SDXL: Old Forest بقلم كريستوفر بالاسكاس

وفي الختام

  • Stable Diffusion يمكن أخيرًا إنتاج نص منطقي.
  • يوفر SDXL صورًا أكثر إرضاءً من الناحية الجمالية من الإصدار 2.1 و (بدرجة أقل) الطرازات v1.5.
  • يُنتج النموذج الجديد صورًا أكثر دقة.
  • تحسن تشريح الإنسان.
  • المطالبات السلبية ليست ضرورية كما في الإصدار 2.1.
  • يمكنه إنشاء صور واقعية.
  • سيتم إصلاح بعض الشذوذ في النموذج قبل الإصدار.

اقرأ المزيد من المقالات ذات الصلة:

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

المزيد من المقالات
دامير يالالوف
دامير يالالوف

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

Hot Stories
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

وصول يوم النطق بالحكم: مصير تشيكوسلوفاكيا معلق في الميزان بينما تنظر المحكمة الأمريكية في التماس وزارة العدل

ومن المقرر أن يواجه Changpeng Zhao الحكم في محكمة أمريكية في سياتل اليوم.

أعرف المزيد

مؤسسو Samourai Wallet متهمون بتسهيل صفقات بقيمة 2 مليار دولار في Darknet

يمثل إلقاء القبض على مؤسسي Samourai Wallet انتكاسة ملحوظة لهذه الصناعة، مما يؤكد استمرار ...

أعرف المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
تتعاون Ankr مع منصة Talus لمنصة AI Blockchain لفتح سيولة Bitcoin للذكاء الاصطناعي
باقة الأعمال تقرير الأخبار تكنولوجيا
تتعاون Ankr مع منصة Talus لمنصة AI Blockchain لفتح سيولة Bitcoin للذكاء الاصطناعي
1 مايو 2024
تدعم Binance Labs مختبرات الحركة لتسهيل تكامل نقل Facebook عبر Blockchains
باقة الأعمال تقرير الأخبار تكنولوجيا
تدعم Binance Labs مختبرات الحركة لتسهيل تكامل نقل Facebook عبر Blockchains
1 مايو 2024
دول البريكس تتطلع إلى حل تجارة العملات المستقرة
باقة الأعمال الأسواق قصص ومراجعات تكنولوجيا
دول البريكس تتطلع إلى حل تجارة العملات المستقرة
1 مايو 2024
تتكامل شبكة Bitcoin L2 BOB مع LayerZero لتعزيز الوظائف
باقة الأعمال تقرير الأخبار تكنولوجيا
تتكامل شبكة Bitcoin L2 BOB مع LayerZero لتعزيز الوظائف
1 مايو 2024
CRYPTOMERIA LABS PTE. المحدودة.