דיווח חדשות טכנולוגיה
ינואר 18, 2023

מיקרוסופט פרסמה מודל דיפוזיה שיכול לבנות אווטאר תלת מימד מתמונה בודדת של אדם

בקיצור

ניתן להשתמש בתמונה דו-ממדית אחת של פניו של אדם ליצירת אווטאר תלת-ממדי באמצעות טכניקת למידת מכונה של 2D Avatar Diffusion.

ניתן להשתמש בו כדי לספק תצוגה תלת מימדית מציאותית של האדם למשחקים או לשימושים אחרים, או לספק חווית מציאות מדומה (VR) או מציאות רבודה (AR).

ה-3D Avatar Diffusion הוא אלגוריתם למידת מכונה שיכול לצלם תמונה דו-ממדית אחת של פנים אנושיות וליצור אווטאר תלת מימדי (2D). לאחר מכן, האווטאר יכול לשמש ליצירת חווית מציאות מדומה (VR) או מציאות רבודה (AR) או פשוט לספק תצוגה תלת-ממדית מציאותית של האדם למטרות משחק או אחרות.

מודל הדיפוזיה היה מפותח על ידי צוות חוקרים ב-Microsoft Research ומתואר במאמר שפורסם בכתב העת arXiv.

מיקרוסופט פרסמה מודל דיפוזיה שיכול לבנות אווטאר תלת מימד מתמונה בודדת של אדם

התפשטות האווטאר התלת-ממדית מבוססת על סוג של אלגוריתם למידת מכונה הנקרא מודל דיפוזיה. מודלים של דיפוזיה הם מודלים גנרטיביים, מה שאומר שהם יכולים ליצור נתונים חדשים הדומים לנתוני האימון. דגמי דיפוזיה שימשו בעבר ליצירת תמונות תלת-ממד מתמונות דו-ממדיות, אך ה-ADM הוא מודל הדיפוזיה הראשון שיכול ליצור אווטאר תלת-ממדי מציאותי מתמונה דו-ממדית אחת.

כדי לאמן את המודל, החוקרים השתמשו במערך נתונים של למעלה מ-200,000 מודלים תלת מימדיים. מערך הנתונים כלל מגוון רחב של פנים עם גווני עור, תסרוקות ותווי פנים שונים. לאחר מכן, ה-ADM היה מסוגל ללמוד את הקשר בין תמונת הדו-ממד למודל הפנים התלת-ממדי וליצור אווטאר תלת-ממדי מציאותי מתמונה דו-ממדית אחת.

הדגם יכול לשמש גם ליצירת אווטאר מתמונה שצולמה מזווית אחרת

עבור האווטאר התלת-ממדי המותאם אישית, מודל רודן מציע מניפולציה מונחית טקסט. עריכת שפה טבעית היא דרך אינטואיטיבית לשנות תכונות רבות ושונות של אווטר תלת מימד.

מחקר זה מציע מודל יצירתי תלת מימדי שיוצר אוטומטית אווטרים דיגיטליים תלת מימדיים המיוצגים כשדות זוהר עצביים באמצעות מודלים של דיפוזיה. בגלל דרישות הזיכרון והעיבוד האסורות הקשורות לתלת-ממד, יצירת התכונות העשירות הנחוצות לאוואטרים באיכות גבוהה היא בעיה ענקית. מפתחים מציעים שרשת הדיפוזיה (Rodin) מטפלת בבעיה זו.

מבחינת מגדר, גיל, גזע, הבעה, אביזרי פנים וכו', הדגם מפגין גיוון דורי יוצא דופן.‏

רשת זו מפרסמת מספר רב של מפות תכונות דו-ממדיות של שדה זוהר עצבי למישור תכונה דו-ממדי יחיד, כאשר המודל מבצע אז דיפוזיה מודעת ל-2D. מודל רודן משתמש בקונבולציה מודעה לתלת-ממד, אשר מטפלת בתכונות המוקרנות במישור התכונה הדו-ממדית בהתאם ליחס המקורי שלהן בתלת-ממד, כדי לספק את היעילות החישובית הנדרשת תוך שמירה על שלמות הדיפוזיה בתלת-ממד.

קרא עוד על AI:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories

Lisk עובר רשמית ל-Ethereum Layer 2 וחושפת Core v4.0.6

by אליסה דוידסון
מאי 08, 2024
הצטרף לניוזלטר שלנו.
חדשות אחרונות

Lisk עובר רשמית ל-Ethereum Layer 2 וחושפת Core v4.0.6

by אליסה דוידסון
מאי 08, 2024

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
Nexo יוזמת את 'המצוד' כדי לתגמל את המשתמשים באסימוני NEXO של 12 מיליון דולר על כך שהם מעורבים במערכת האקולוגית שלה
שוקי דיווח חדשות טכנולוגיה
Nexo יוזמת את 'המצוד' כדי לתגמל את המשתמשים באסימוני NEXO של 12 מיליון דולר על כך שהם מעורבים במערכת האקולוגית שלה
מאי 8, 2024
Revolut X Exchange של Revolut שוקדת על סוחרי קריפטו עם אפס עמלות יצרן, וניתוח מתקדם
שוקי תוכנה סיפורים וסקירות טכנולוגיה
Revolut X Exchange של Revolut שוקדת על סוחרי קריפטו עם אפס עמלות יצרן, וניתוח מתקדם
מאי 8, 2024
פלטפורמת מסחר קריפטו BitMEX מציגה לראשונה מסחר באופציות עם 0 עמלות ותמריצים במזומן
עסקים שוקי דיווח חדשות
פלטפורמת מסחר קריפטו BitMEX מציגה לראשונה מסחר באופציות עם 0 עמלות ותמריצים במזומן
מאי 8, 2024
Lisk עובר רשמית ל-Ethereum Layer 2 וחושפת Core v4.0.6
דיווח חדשות טכנולוגיה
Lisk עובר רשמית ל-Ethereum Layer 2 וחושפת Core v4.0.6
מאי 8, 2024
CRYPTOMERIA LABS PTE. בע"מ.