דיווח חדשות טכנולוגיה
ספטמבר 19, 2023

גוגל מציגה דינמיקת תמונה גנרטיבית חדשנית המדמה סצנות דינמיות בתמונות סטטיות

גוגל חשפה א דינמיקת תמונה גנרטיבית, גישה חדשנית מאפשרת טרנספורמציה של א תמונה סטטית יחידה לסרטון לולאה חלק או סצנה דינמית אינטראקטיבית, המציעה מגוון רחב של יישומים מעשיים.

גוגל מציגה דינמיקת תמונה גנרטיבית חדשנית המדמה סצנות דינמיות בתמונות סטטיות

בבסיסה של טכנולוגיה חלוצית זו הוא המודל של מרחב תמונה לפני דינמיקה של הסצנה. המטרה היא ליצור הבנה מקיפה של האופן שבו אובייקטים ואלמנטים בתוך תמונה עשויים להתנהג כאשר הם נתונים לאינטראקציות דינמיות שונות. לאחר מכן ניתן להשתמש בהבנה זו כדי לדמות את התגובה של דינמיקת אובייקטים לאינטראקציות של משתמשים בצורה יעילה.

התכונה המרכזית של טכנולוגיה זו היא היכולת ליצור סרטוני לולאה חלקים. על ידי מינוף מרחב התמונה לפני הדינמיקה של הסצנה, המערכת של גוגל יכולה להרחיב ולהרחיב את התנועה של אלמנטים בתוך תמונה, ולהפוך אותה ללולאת וידאו שובת לב ומתמשכת. פונקציונליות זו פותחת אפשרויות יצירתיות רבות עבור יוצרי תוכן ומעצבים.

המאמר מציג גישה למודל של מרחב תמונה-פריור המבוסס על דינמיקה של סצנה, הנלמדת מאוסף של מסלולי תנועה המופקים מרצפי וידאו אמיתיים המכילים תנועה טבעית ומתנדנדת כגון עצים, פרחים, נרות ובגדים הנושבים ברוח . המודל המאומן משתמש בתהליך דגימת דיפוזיה מתואם תדר כדי לחזות ייצוג תנועה לטווח ארוך לכל פיקסל בתחום פורייה, אותו הם מכנים מרקם תנועה סטוכסטית עצבית. ניתן להמיר את הייצוג הזה למסלולי תנועה צפופים המשתרעים על סרטון שלם.

הטכנולוגיה מאפשרת למשתמשים ליצור אינטראקציה עם אובייקטים בתוך תמונות סטטיות בצורה מציאותית. על ידי הדמיית התגובה של דינמיקת אובייקטים לעירור משתמשים, המערכת של גוגל מאפשרת חוויות סוחפות ואינטראקטיביות בתוך תמונות. יש לזה פוטנציאל לחולל מהפכה רווחים מטאוורסים וכיצד משתמשים עוסקים בתוכן ויזואלי.

המחקר בוחן מודלים של קדמה יצירתית לתנועת סצנה בין תמונה למרחב, כלומר, התנועה של כל הפיקסלים בתמונה אחת. המודל מאומן על מסלולי תנועה שחולצו אוטומטית מאוסף גדול של קטעי וידאו אמיתיים. מותנה בתמונת קלט, המודל המאומן מנבא מרקם תנועה סטוכסטית עצבית: קבוצה של מקדמים של בסיס תנועה המאפיינים את המסלול של כל פיקסל לעתיד.

הבסיס של חדשנות זו טמון במודל שעבר הכשרה קפדנית. המודל של גוגל לומד ממערך נתונים עצום של מסלולי תנועה המופקים מרצפי וידאו אמיתיים הכוללים תנועה טבעית ומתנודדת. סיקוונסים אלה כוללים סצנות עם אלמנטים כמו עצים מתנדנדים, פרחים זזים, נרות מרצדים ובגדים מתנפחים ברוח. מערך נתונים מגוון זה מאפשר למודל להבין מגוון רחב של התנהגויות דינמיות.

היקף המחקר מוגבל לסצנות בעולם האמיתי עם דינמיקה טבעית ומתנודדת, כמו עצים ופרחים הנעים ברוח. סדרת פורייה נבחרת כפונקציות הבסיס. לאחר מכן ניתן להפוך את מרקמי מרחב התדרים המתקבלים למסלולי תנועה של פיקסלים צפופים וארוכי טווח, בהם ניתן להשתמש כדי לסנתז פריימים עתידיים, ולהפוך תמונות סטילס לאנימציות ריאליסטיות.

כאשר מוצג עם א תמונה בודדת, המודל המאומן משתמש בתהליך דגימת דיפוזיה מתואם תדר. תהליך זה מנבא ייצוג תנועה לכל פיקסל לטווח ארוך בתחום פורייה, המכונה מרקם תנועה סטוכסטית עצבית. ייצוג זה הופך לאחר מכן למסלולי תנועה צפופים המשתרעים על סרטון שלם. יחד עם מודול עיבוד מבוסס תמונה, ניתן לרתום את המסלולים הללו ליישומים מעשיים שונים.

בהשוואה לקודמים על פני פיקסלים RGB גולמיים, פריטים על פני תנועה לוכדים מבנה תת-ממדי בסיסי יותר, בעל מימד נמוך יותר, שמסביר ביעילות שינויים בערכי הפיקסלים. זה מוביל ליצירת קוהרנטית יותר לטווח ארוך ולשליטה עדינה יותר באנימציות בהשוואה לשיטות קודמות שמבצעות אנימציית תמונה באמצעות סינתזת וידאו גולמי.

ייצוג התנועה שנוצר נוח למספר יישומים במורד הזרם, כגון יצירת סרטוני לולאה חלקים, עריכת התנועה שנוצרה ואפשרות אינטראקטיבית תמונות דינמיות, המדמה את התגובה של דינמיקת אובייקטים לכוחות המופעלים על ידי המשתמש.

קרא עוד נושאים קשורים:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

מ-Ripple ל-DAO הירוק הגדול: כיצד פרויקטים של מטבעות קריפטו תורמים לצדקה

בואו לחקור יוזמות המנצלות את הפוטנציאל של מטבעות דיגיטליים למטרות צדקה.

יודע יותר

AlphaFold 3, Med-Gemini ואחרים: הדרך בינה מלאכותית משנה את שירותי הבריאות ב-2024

בינה מלאכותית מתבטאת בדרכים שונות בתחום הבריאות, מחשיפת מתאמים גנטיים חדשים ועד העצמת מערכות כירורגיות רובוטיות...

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
מ-Ripple ל-DAO הירוק הגדול: כיצד פרויקטים של מטבעות קריפטו תורמים לצדקה
אָנָלִיזָה האנוסים Wiki עסקים חינוך סגנון חיים שוקי תוכנה טכנולוגיה
מ-Ripple ל-DAO הירוק הגדול: כיצד פרויקטים של מטבעות קריפטו תורמים לצדקה
מאי 13, 2024
AlphaFold 3, Med-Gemini ואחרים: הדרך בינה מלאכותית משנה את שירותי הבריאות ב-2024
AI Wiki אָנָלִיזָה תקציר דעה עסקים שוקי דיווח חדשות תוכנה סיפורים וסקירות טכנולוגיה
AlphaFold 3, Med-Gemini ואחרים: הדרך בינה מלאכותית משנה את שירותי הבריאות ב-2024
מאי 13, 2024
רשת נים תוציא מסגרת אסימון בעלות בינה מלאכותית ותבצע מכירת תשואה עם תאריך תמונת מצב מתוכנן למאי
שוקי דיווח חדשות טכנולוגיה
רשת נים תוציא מסגרת אסימון בעלות בינה מלאכותית ותבצע מכירת תשואה עם תאריך תמונת מצב מתוכנן למאי
מאי 13, 2024
Binance משתפת פעולה עם ארגנטינה כדי להילחם בפשעי סייבר
דעה עסקים שוקי דיווח חדשות תוכנה טכנולוגיה
Binance משתפת פעולה עם ארגנטינה כדי להילחם בפשעי סייבר
מאי 13, 2024
CRYPTOMERIA LABS PTE. בע"מ.