דיווח חדשות טכנולוגיה
23 בנובמבר 2022

טקסט ל-SVG: ברקלי הכריזה על הפשטה של ​​מודל דיפוזיה מבוסס פיקסלים

בקיצור

סינתזה של טקסט לתמונה - חוקרי UC Berkeley מדגימים גרפיקה וקטורית עם תנאי טקסט מודלים של דיפוזיה

בסינתזה של טקסט לתמונה, יש מודלים של דיפוזיה מופגן תוצאות יוצאות דופן. מודלים של דיפוזיה לומדים לייצר תמונות רסטר של אובייקטים ומצבים מגוונים ביותר באמצעות מסדי נתונים עצומים של תמונות מוערות. עם זאת, עבור סמלים דיגיטליים, גרפיקה ומדבקות, מעצבים משתמשים בדרך כלל בייצוגים וקטוריים של תמונות כמו גרפיקה וקטורית מדרגית (SVG). גרפיקה וקטורית קטנה וניתן להתאים אותה לכל גודל.

טקסט ל-SVG: ברקלי הכריזה על הפשטה של ​​מודל דיפוזיה מבוסס פיקסלים

UC Berkeley מדגים כיצד לייצר גרפיקה וקטורית שניתן לייצא כ-SVG באמצעות מודל דיפוזיה מותנה בטקסט שהוכשר על ייצוגי פיקסלים של תמונה. הוא משיג זאת מבלי להשתמש באוספים נרחבים של SVGs עם כיתובים. במקום זאת, חוקרי ברקלי מדגימים את א פיזור טקסט לתמונה לדגום ולכוונן אותו עם אובדן Score Distillation Sampling, המוטיבציה מעבודה אחרונה על סינתזה של טקסט ל-3D.

וקטורים שנוצרו לדוגמה

בדוק את גלריית ה-SVG החדשה שנוצרה כאן.

גרפיקה וקטורית קטנה אך שומרת על החדות שלה כאשר משנים אותה לכל גודל. חוקרים ב-Berkeley משפרים אובדן של תמונה-טקסט על בסיס דגימת זיקוק ציונים כדי לייעל גרפיקה וקטורית. המעבד SVG הניתן להבדיל DiffVG, המשמש את VectorFusion, מאפשר חזותיים הפוכים.

בנוסף, VectorFusion מאפשרת תצורה רב-שלבית שהיא יעילה יותר ואיכותית יותר. שיטה זו מתחילה בלקיחת דגימות רסטר מה- מודל פיזור טקסט לתמונה נקרא Stable Diffusion. לאחר מכן עוקבים אחר הדגימות באופן אוטומטי על ידי VectorFusion באמצעות LIVE. דגימות אלו, עם זאת, לעתים קרובות חסרות פרטים, משעממות או שקשה להתאים אותן לגרפיקה וקטורית. שיפור החיוניות והעקביות הטקסטואלית באמצעות דגימת זיקוק ציונים.

VectorFusion יכולה לייצר פיקסלים בסגנון של משחקי וידאו ישנים על ידי הגבלת נתיבי SVG לריבועים ברשת.

גישה זו מורחבת בקלות כדי לתמוך ביצירת טקסט לסקיצה. על מנת ללמוד ציור קו מופשט המייצג במדויק את הטקסט שסופק על ידי המשתמש, אנו מציירים תחילה 16 קווים שנבחרו באקראי. לאחר מכן, אנו מייעלים את אובדן הדגימה הסמויה של ציון זיקוק.

קרא מאמרים קשורים:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר

מייסדי ארנק סמוראי הואשמו בהנחיית 2 מיליארד דולר בעסקאות Darknet

החשש של מייסדי ארנק סמוראי מייצג כישלון בולט עבור התעשייה, המדגיש את ...

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קרא עוד
Pantera Capital משקיעה ב-TON Blockchain, מביעה אמון בפוטנציאל של טלגרם להרחיב את נגישות הקריפטו
עסקים דיווח חדשות טכנולוגיה
Pantera Capital משקיעה ב-TON Blockchain, מביעה אמון בפוטנציאל של טלגרם להרחיב את נגישות הקריפטו
מאי 2, 2024
מיטוזיס מגייסת מימון של 7 מיליון דולר מקבוצת Amber ומיזמי Foresight כדי לקדם את פרוטוקול הנזילות המודולרי שלה
עסקים דיווח חדשות טכנולוגיה
מיטוזיס מגייסת מימון של 7 מיליון דולר מקבוצת Amber ומיזמי Foresight כדי לקדם את פרוטוקול הנזילות המודולרי שלה
מאי 2, 2024
Galxe משתפת פעולה עם Jambo כדי להרחיב את הנגישות הגלובלית ל Web3
עסקים דיווח חדשות טכנולוגיה
Galxe משתפת פעולה עם Jambo כדי להרחיב את הנגישות הגלובלית ל Web3
מאי 2, 2024
ה-Med-Gemini של גוגל מוכנה לתת ראש בראש GPT-4 עם ביצועים מעולים בתחום הבריאות
AI Wiki חֲדָשׁוֹת תוכנה טכנולוגיה
ה-Med-Gemini של גוגל מוכנה לתת ראש בראש GPT-4 עם ביצועים מעולים בתחום הבריאות
מאי 2, 2024
CRYPTOMERIA LABS PTE. בע"מ.