نص إلى SVG: أعلنت بيركلي عن تجريد نموذج الانتشار المستند إلى البكسل
في سطور
تركيب نص إلى صورة - يعرض باحثو جامعة كاليفورنيا في بيركلي رسومات متجهة مع نص مكيف نماذج الانتشار
في تركيب النص إلى الصورة ، نماذج الانتشار لها تظاهر نتائج رائعة. تتعلم نماذج الانتشار إنتاج صور نقطية لكائنات وحالات متنوعة للغاية باستخدام قواعد بيانات هائلة للصور المشروحة. ومع ذلك ، بالنسبة للأيقونات الرقمية والرسومات والملصقات ، يستخدم المصممون عادةً تمثيلات متجهية للصور مثل Scalable Vector Graphics (SVGs). رسومات المتجهات صغيرة ويمكن تغيير حجمها إلى أي حجم.
توضح جامعة كاليفورنيا في بيركلي كيفية إنتاج رسومات متجهة يمكن تصديرها بتنسيق SVG باستخدام نموذج نشر مكيف تم تدريبه على تمثيلات بكسل الصورة. يتم تحقيق ذلك دون استخدام مجموعات واسعة من SVGs مع التسميات التوضيحية. بدلاً من ذلك ، قام باحثو بيركلي بتوجيه أ نشر النص إلى الصورة أخذ عينة منها وضبطها باستخدام فقد أخذ عينات تقطير النقاط ، بدافع العمل الأخير على توليف النص إلى ثلاثي الأبعاد.
تم إنشاء نواقل المثال
تحقق من معرض SVG الذي تم إنشاؤه حديثًا هنا.
الرسومات المتجهة صغيرة ولكنها تحافظ على حدتها عند تغيير حجمها إلى أي حجم. يقوم الباحثون في بيركلي بتحسين فقدان نص الصورة بناءً على أخذ عينات التقطير لتحسين الرسومات المتجهة. يجعل عارض SVG DiffVG القابل للتفاضل ، والذي تستخدمه VectorFusion ، المرئيات العكسية ممكنة.
بالإضافة إلى ذلك ، يتيح VectorFusion تكوينًا متعدد المراحل يكون أكثر فاعلية وجودة أعلى. تبدأ هذه الطريقة بأخذ عينات نقطية من ملف نموذج نشر النص إلى الصورة تسمى Stable Diffusion. ثم يتم تتبع العينات تلقائيًا بواسطة VectorFusion باستخدام LIVE. هذه العينات ، مع ذلك ، غالبًا ما تفتقر إلى التفاصيل ، أو مملة ، أو يصعب تكييفها مع الرسومات المتجهة. تعزيز الحيوية والاتساق النصي من خلال أخذ عينات التقطير.
يمكن لـ VectorFusion إنتاج فن البكسل بأسلوب ألعاب الفيديو القديمة عن طريق قصر مسارات SVG على المربعات الموجودة على الشبكة.
يتم توسيع هذا النهج بسهولة لدعم إنشاء نص إلى رسم. من أجل تعلم رسم خط تجريدي يمثل بدقة النص المقدم من المستخدم ، نقوم أولاً برسم 16 حدًا تم اختياره عشوائيًا. بعد ذلك ، نقوم بتحسين فقدان عينات التقطير الكامن لدينا.
اقرأ المقالات ذات الصلة:
إخلاء المسئولية
تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.
نبذة عن الكاتب
دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.
المزيد من المقالاتدامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.