گزارش خبری پیشرفته
نوامبر 23، 2022

متن به SVG: برکلی مدل انتشار مبتنی بر پیکسل انتزاعی را اعلام کرد

به طور خلاصه

سنتز متن به تصویر - محققان دانشگاه کالیفرنیا برکلی گرافیک برداری را با متن شرطی نشان می دهند مدل های انتشار

در سنتز متن به تصویر، مدل های انتشار دارند نشان نتایج برجسته مدل‌های انتشار یاد می‌گیرند که تصاویر شطرنجی از اشیا و موقعیت‌های بسیار متنوع را با استفاده از پایگاه داده‌های عظیم عکس‌های حاشیه‌نویسی تولید کنند. با این حال، برای آیکون‌های دیجیتال، گرافیک‌ها و برچسب‌ها، طراحان معمولاً از نمایش‌های برداری از تصاویر مانند Scalable Vector Graphics (SVG) استفاده می‌کنند. گرافیک های برداری کوچک هستند و ممکن است به هر اندازه ای کوچک شوند.

متن به SVG: برکلی مدل انتشار مبتنی بر پیکسل انتزاعی را اعلام کرد

UC Berkeley نشان می‌دهد که چگونه می‌توان گرافیک‌های برداری را تولید کرد که می‌توان آن‌ها را به‌صورت SVG با استفاده از یک مدل انتشار مشروط متن که بر روی نمایش‌های پیکسل تصویر آموزش داده شده بود، صادر کرد. این کار را بدون استفاده از مجموعه‌های گسترده SVG با زیرنویس انجام می‌دهد. در عوض، محققان برکلی a انتشار متن به تصویر نمونه برداری کنید و آن را با کاهش امتیاز از تقطیر نمونه برداری، به انگیزه کار اخیر روی سنتز متن به سه بعدی تنظیم کنید.

نمونه بردارهای تولید شده

گالری SVG تازه تولید شده را بررسی کنید اینجا کلیک نمایید.

گرافیک های برداری کوچک هستند اما وضوح خود را هنگامی که به هر اندازه ای کوچک می شوند حفظ می کنند. محققان در برکلی برای بهینه سازی گرافیک برداری، از دست دادن تصویر-متن را بر اساس Score Distillation Sampling بهبود می بخشند. رندر SVG متمایز DiffVG، که توسط VectorFusion استفاده می شود، تصاویری معکوس را ممکن می کند.

علاوه بر این، VectorFusion امکان پیکربندی چند مرحله ای را فراهم می کند که موثرتر و با کیفیت تر است. این روش با گرفتن نمونه های شطرنجی شروع می شود مدل انتشار متن به تصویر نام Stable Diffusion. سپس نمونه ها به طور خودکار توسط VectorFusion با استفاده از LIVE ردیابی می شوند. با این حال، این نمونه‌ها اغلب فاقد جزئیات هستند، خسته‌کننده هستند یا سازگاری با گرافیک برداری دشوار است. افزایش سرزندگی و سازگاری متنی از طریق نمونه گیری تقطیر امتیازی.

VectorFusion می تواند با محدود کردن مسیرهای SVG به مربع در یک شبکه، هنری پیکسلی را به سبک بازی های ویدیویی قدیمی تولید کند.

این رویکرد به راحتی برای پشتیبانی از تولید متن به طرح گسترش می یابد. به منظور یادگیری یک خط انتزاعی که به طور دقیق متن ارائه شده توسط کاربر را نشان می دهد، ابتدا 16 ضربه انتخاب شده به طور تصادفی ترسیم می کنیم. سپس، از دست دادن نمونه تقطیر امتیاز نهفته خود را بهینه می کنیم.

مقالات مرتبط را بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید

بنیانگذاران کیف پول سامورایی متهم به تسهیل 2 میلیارد دلار در معاملات Darknet شدند

دلهره از بنیانگذاران کیف پول سامورای نشان دهنده یک شکست قابل توجه برای صنعت است که تاکیدی بر ادامه دار بودن ...

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
Pantera Capital در بلاک چین TON سرمایه گذاری می کند و به پتانسیل تلگرام برای گسترش دسترسی به رمزنگاری اعتماد دارد
کسب و کار گزارش خبری پیشرفته
Pantera Capital در بلاک چین TON سرمایه گذاری می کند و به پتانسیل تلگرام برای گسترش دسترسی به رمزنگاری اعتماد دارد
ممکن است 2، 2024
میتوز 7 میلیون دلار از Amber Group و Foresight Ventures برای پیشبرد پروتکل نقدینگی مدولار خود جمع آوری می کند.
کسب و کار گزارش خبری پیشرفته
میتوز 7 میلیون دلار از Amber Group و Foresight Ventures برای پیشبرد پروتکل نقدینگی مدولار خود جمع آوری می کند.
ممکن است 2، 2024
Galxe با Jambo همکاری می کند تا دسترسی جهانی را گسترش دهد Web3
کسب و کار گزارش خبری پیشرفته
Galxe با Jambo همکاری می کند تا دسترسی جهانی را گسترش دهد Web3
ممکن است 2، 2024
Google's Med-Gemini آماده است تا شروعی به کار کند GPT-4 با عملکرد برتر آن در مراقبت های بهداشتی
AI Wiki رسانه نرم افزار پیشرفته
Google's Med-Gemini آماده است تا شروعی به کار کند GPT-4 با عملکرد برتر آن در مراقبت های بهداشتی
ممکن است 2، 2024
CRYPTOMERIA LABS PTE. محدود