דיווח חדשות
ספטמבר 30, 2022

טקסט לתלת-ממד: גוגל פיתחה רשת עצבית המייצרת מודלים תלת-ממדיים מתיאורי טקסט

בקיצור

טקסט לתלת מימד רשת עצבית יכולה ליצור מודלים תלת מימדיים מטקסט

DreamFusion מבצע אופטימיזציה של סצנות תלת מימד על בסיס טקסט לתמונה של Imagen

ניתן להשתמש במודל דיפוזיה דו-ממדי עבור סינתזה של טקסט לתמונה

גוגל יצרה א רשת עצבית מסוגל ליצור מודלים תלת מימדיים מתיאורי טקסט. החלק הטוב ביותר הוא שאת ההיבט הקשה ביותר לא היה צורך אפילו ללמד. Imagen שימש כבסיס ל-Text-to-3D.

טקסט לתלת-ממד: גוגל פיתחה רשת עצבית המייצרת מודלים תלת-ממדיים מתיאורי טקסט

על מה כדאי לדעת DreamFusion?

מודלים של דיפוזיה שהוכשרו על מיליארדי זוגות תמונה-טקסט הובילו להתקדמות לאחרונה בסינתזה של טקסט לתמונה. התאמת גישה זו לסינתזה תלת-ממדית תחייב מערכי נתונים בקנה מידה גדול של נכסי תלת-ממד מתויגים וכן ארכיטקטורות נתונים תלת-ממדיות לניתור יעיל, שאף אחת מהן אינה זמינה כעת. במאמר זה, אנו מתגברים על מגבלות אלו על ידי ביצוע סינתזה של טקסט לתלת-ממד עם דו-ממד מאומן מראש פיזור טקסט לתמונה דֶגֶם. אנו מציגים הפסד המבוסס על זיקוק צפיפות הסתברות המאפשר שימוש במודל דיפוזיה דו-ממדי כקודם לייעול פרמטרי מחולל תמונות. באמצעות אובדן זה, אנו משתמשים בירידה בשיפוע כדי לבצע אופטימיזציה של מודל תלת-ממדי מאותחל באקראי (שדה ראנה עצבי או NeRF) כך שלעיבודים הדו-ממדיים שלו מזוויות אקראיות יהיה אובדן מינימלי.

ניתן לראות את מודל התלת-ממד שנוצר של הטקסט שצוין מכל זווית, להאיר בתאורה משתנה, ולחבר אותו לכל סביבה תלת-ממדית. השיטה שלה לא דורשת נתוני אימון תלת מימד וללא שינויים ב מודל פיזור תמונה, הממחיש את היעילות של שימוש במודלים של דיפוזיה של תמונה מאומנים מראש כמו קודם.

DreamFusion מייצרת דגמי תלת מימד אלגנטיים עם מראה, עומק ונורמליות בנאמנות גבוהה על סמך כיתוב. אובייקטים מיוצגים כשדה זוהר עצבי, עם אימון מראש פיזור טקסט לתמונה קודם כמו Imagen בשימוש.

דוגמאות לתלת מימד שנוצר מטקסט

הנחיה: תמונה של סנאי לובש חליפת שריון מימי הביניים מנגן על סקסופון
הנחיה: תמונה של סנאי לובש חלוק אלגנטי יושב ליד גלגל חרס ומעצב קערת חרס
הנחיה: פסל מתכת מפורט ביותר של סנאי לובש קפוצ'ון סגול רוכב על אופנוע
הנחיה: גילוף עץ מורכב של סנאי לובש חליפת שריון מימי הביניים עם קטאנה

חיבור חפצים ליצירת סצנה

איך זה עובד?

DreamFusion מבצע אופטימיזציה של סצנה תלת מימדית בהתבסס על כיתוב באמצעות המודל המחולל טקסט לתמונה של Imagen. הוא מציע דגימת זיקוק ציון (SDS), הכוללת אופטימיזציה של פונקציית אובדן להפקת דגימות ממודל דיפוזיה. כל עוד אנחנו יכולים למפות חזרה לתמונות בצורה שונה, SDS מאפשר לנו לבצע אופטימיזציה של דוגמאות בכל מרחב פרמטר, כמו מרחב תלת מימדי. ל defiלא המיפוי הניתן להבדיל זה, הוא משתמש בפרמטריזציה של סצינה תלת-ממדית הדומה ל-Neural Radiance Fields או NeRFs. SDS לבדו יוצר מראה סצינה סביר, אבל DreamFusion משפר את הגיאומטריה עם מסדרים נוספים וטכניקות אופטימיזציה. NeRFs המאומנים המיוצרים הם קוהרנטיים, בעלי נורמליות מצוינות, גיאומטריית פני השטח ועומק, וניתן להדליק אותם מחדש באמצעות מודל הצללה למברטיאני.

קרא מאמרים קשורים:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
Injective מאחדת כוחות עם AltLayer כדי להביא אבטחה מחדש ל-inEVM
עסקים דיווח חדשות טכנולוגיה
Injective מאחדת כוחות עם AltLayer כדי להביא אבטחה מחדש ל-inEVM
מאי 3, 2024
מאסה משתפת פעולה עם Teller כדי להציג את מאגר ההלוואות של MASA, מאפשרת הלוואות ב-USDC על בסיס
שוקי דיווח חדשות טכנולוגיה
מאסה משתפת פעולה עם Teller כדי להציג את מאגר ההלוואות של MASA, מאפשרת הלוואות ב-USDC על בסיס
מאי 3, 2024
Velodrome משיקה את גרסת הבטא של Superchain בשבועות הקרובים ומתרחבת ברחבי OP Stack Layer 2 Blockchains
שוקי דיווח חדשות טכנולוגיה
Velodrome משיקה את גרסת הבטא של Superchain בשבועות הקרובים ומתרחבת ברחבי OP Stack Layer 2 Blockchains
מאי 3, 2024
CARV מכריזה על שותפות עם Aethir לביזור שכבת הנתונים שלה ולחלוקת תגמולים
עסקים דיווח חדשות טכנולוגיה
CARV מכריזה על שותפות עם Aethir לביזור שכבת הנתונים שלה ולחלוקת תגמולים
מאי 3, 2024
CRYPTOMERIA LABS PTE. בע"מ.