تقرير الأخبار تكنولوجيا
19 حزيران، 2023

SnapFusion: نموذج سريع لتحويل النص إلى صورة للأجهزة المحمولة في غضون 1.9 ثانية

في سطور

يقوم SnapFusion بتغيير إنشاء المحتوى عن طريق التشغيل نماذج نشر النص إلى الصورة مباشرة على الأجهزة المحمولة ، مما يقلل التكاليف ومعالجة مخاوف الخصوصية.

سناب فيوجن هو نموذج AI لتحويل النص إلى صورة يمكّن المستخدمين من إنشاء صور مذهلة من أوصاف اللغة الطبيعية ، كل ذلك في غضون ثانيتين فقط على أجهزتهم المحمولة. لقد ولت أيام الاعتماد على وحدات معالجة الرسومات المتطورة أو الخدمات المستندة إلى السحابة لتشغيل هذه النماذج المعقدة. يقوم SnapFusion بإضفاء الطابع الديمقراطي على إنشاء المحتوى من خلال وضع قوة نشر النص إلى صورة في أيدي المستخدمين.

SnapFusion: نموذج تحويل النص إلى صورة سريع وفعال للأجهزة المحمولة في غضون 1.9 ثانية
الائتمان: Midjourney / lili10292 # 2100

لطالما كان إنشاء صور واقعية من أوصاف نصية مهمة صعبة. الموديلات السابقة مطلوب معماريات شبكة كبيرة وتكرارات متعددة لتقليل الضوضاء ، مما يجعلها مكلفة حسابيًا وبطيئة. علاوة على ذلك ، فإن تشغيل هذه النماذج غالبًا ما ينطوي على إرسال بيانات المستخدم إلى خدمات الطرف الثالث ، وزيادة مخاوف الخصوصية.

لمواجهة هذه التحديات ، قام منشئو SnapFusion بتطوير بنية شبكة فعالة وتحسين عملية التقطير التدريجي. من خلال تحديد التكرار في النموذج الأصلي ، قاموا بتقديم UNet فعال وقللوا من حساب وحدة فك ترميز الصورة من خلال تقطير البيانات. بالإضافة إلى ذلك ، قاموا بتحسين التقطير التدريجي من خلال استكشاف استراتيجيات التدريب وإدخال تقنيات التنظيم.

arxiv.org/pdf/2306.00980.pdf

تجارب مكثفة على مجموعة بيانات MS-COCO أظهر تفوق SnapFusion. من خلال ثماني خطوات فقط لتقليل الضوضاء ، حقق SnapFusion درجات أفضل في FID و CLIP مقارنةً بالسابق نموذج على أحدث طراز, Stable Diffusion الإصدار 1.5 ، والذي يتطلب 50 خطوة. هذا التحسن الملحوظ في الكفاءة والأداء يفتح إمكانيات جديدة لإنشاء المحتوى.

يتجاوز تأثير SnapFusion إنجازاته التقنية. عن طريق الركض نماذج نشر النص إلى الصورة مباشرة على الأجهزة المحمولة ، فإنه يلغي الحاجة إلى وحدات معالجة الرسومات باهظة الثمن والخدمات المستندة إلى السحابة. لا يقلل هذا من التكاليف فحسب ، بل يعالج أيضًا مخاوف الخصوصية المرتبطة بإرسال بيانات المستخدم إلى جهات خارجية. يمكن للمستخدمين الآن إطلاق العنان لإبداعهم وإنشاء صور عالية الجودة أثناء التنقل.

يمكن تقليل حجم معلمة النموذج بشكل أكبر لجعله متوافقًا مع الأجهزة الطرفية المختلفة. بالإضافة إلى ذلك ، تحسين النموذج للأجهزة المحمولة المختلفة لـ تحقيق الاستدلال السريع السرعات هو موضوع بحث مستمر.

من الضروري استخدام SnapFusion والتقنيات المماثلة بشكل مسؤول لمنع التطبيقات الضارة. يمكن اتخاذ إجراءات ، مثل أنظمة الكشف التلقائي التي تحدد محتوى الصور الذي ينتهك اللوائح وتضع علامة عليه. من خلال تحقيق التوازن بين الابتكار والاعتبارات الأخلاقية ، يمكن لـ SnapFusion تغيير إنشاء المحتوى مع ضمان تجربة مستخدم آمنة ومسؤولة.

اقرأ المزيد عن الذكاء الاصطناعي:

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

المزيد من المقالات
دامير يالالوف
دامير يالالوف

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

Hot Stories
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

تنمو الشهية المؤسسية تجاه صناديق الاستثمار المتداولة في البيتكوين وسط التقلبات

تكشف الإفصاحات من خلال ملفات 13F عن مستثمرين مؤسسيين بارزين يشتغلون بصناديق الاستثمار المتداولة في البيتكوين، مما يؤكد القبول المتزايد لـ ...

لمعرفة المزيد

وصول يوم النطق بالحكم: مصير تشيكوسلوفاكيا معلق في الميزان بينما تنظر المحكمة الأمريكية في التماس وزارة العدل

ومن المقرر أن يواجه Changpeng Zhao الحكم في محكمة أمريكية في سياتل اليوم.

لمعرفة المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
أسواق زيتا تبدأ المجتمع Airdrop، يخصص 1% من إمدادات Z Token لمجتمعات Solana
الأسواق تقرير الأخبار تكنولوجيا
أسواق زيتا تبدأ المجتمع Airdrop، يخصص 1% من إمدادات Z Token لمجتمعات Solana
8 مايو 2024
سندات بنك التنمية الألماني الرقمية القائمة على تقنية البلوكشين: قفزة نحو نظام بيئي مالي أكثر شفافية وكفاءة
باقة الأعمال تطبيقات الكمبيوتر قصص ومراجعات تكنولوجيا
سندات بنك التنمية الألماني الرقمية القائمة على تقنية البلوكشين: قفزة نحو نظام بيئي مالي أكثر شفافية وكفاءة
8 مايو 2024
قانون التبرعات المعدل في كوريا الجنوبية: هل هو خطوة للأمام أم للخلف بالنسبة للعمل الخيري المشفر؟
التشفير Wiki استوعب باقة الأعمال الأسواق تكنولوجيا
قانون التبرعات المعدل في كوريا الجنوبية: هل هو خطوة للأمام أم للخلف بالنسبة للعمل الخيري المشفر؟
8 مايو 2024
الذكاء الاصطناعي التوليدي في عام 2024: الاتجاهات الناشئة والإنجازات والتوقعات المستقبلية
AI Wiki تطبيقات الكمبيوتر قصص ومراجعات تكنولوجيا
الذكاء الاصطناعي التوليدي في عام 2024: الاتجاهات الناشئة والإنجازات والتوقعات المستقبلية
8 مايو 2024
CRYPTOMERIA LABS PTE. المحدودة.