تقرير الأخبار تكنولوجيا
19 سبتمبر 2023

تقدم Google ديناميكيات الصور التوليدية المبتكرة التي تحاكي المشاهد الديناميكية في الصور الثابتة

كشفت شركة جوجل عن ديناميات الصورة التوليدية، نهج جديد يتيح تحويل أ صورة ثابتة واحدة في فيديو حلقات سلس أو مشهد ديناميكي تفاعلي يقدم مجموعة واسعة من التطبيقات العملية.

تقدم Google ديناميكيات الصور التوليدية المبتكرة التي تحاكي المشاهد الديناميكية في الصور الثابتة

في قلب هذه التقنية الرائدة توجد نمذجة مساحة الصورة قبل ديناميكيات المشهد. الهدف هو خلق فهم شامل لكيفية تصرف الأشياء والعناصر الموجودة في الصورة عند تعرضها لتفاعلات ديناميكية مختلفة. يمكن بعد ذلك استخدام هذا الفهم لمحاكاة استجابة ديناميكيات الكائن لتفاعلات المستخدم بشكل فعال.

الميزة الرئيسية لهذه التقنية هي القدرة على إنشاء مقاطع فيديو متكررة بشكل سلس. ومن خلال الاستفادة من ديناميكيات مساحة الصورة السابقة على المشهد، يستطيع نظام Google استقراء وتوسيع حركة العناصر داخل الصورة، وتحويلها إلى حلقة فيديو آسرة ومستمرة. تفتح هذه الوظيفة العديد من الإمكانيات الإبداعية لمنشئي المحتوى ومصمميه.

يقدم البحث طريقة لنمذجة مساحة الصورة السابقة بناءً على ديناميكيات المشهد، والتي يتم تعلمها من مجموعة مسارات الحركة المستخرجة من تسلسلات فيديو حقيقية تحتوي على حركة طبيعية متذبذبة مثل الأشجار والزهور والشموع والملابس التي تهب في مهب الريح. . يستخدم النموذج المدرّب عملية أخذ عينات انتشار منسقة بالتردد للتنبؤ بتمثيل الحركة طويل المدى لكل بكسل في مجال فورييه، والذي يسمونه نسيج الحركة العشوائية العصبية. يمكن تحويل هذا التمثيل إلى مسارات حركة كثيفة تمتد على مقطع فيديو بأكمله.

تتيح هذه التقنية للمستخدمين التفاعل مع الكائنات داخل الصور الثابتة بشكل واقعي. من خلال محاكاة استجابة ديناميكيات الكائن لإثارة المستخدم، يسمح نظام Google بذلك تجارب غامرة وتفاعلية ضمن الصور. وهذا لديه القدرة على إحداث ثورة مساحات ميتافيرس وكيفية تفاعل المستخدمين مع المحتوى المرئي.

تستكشف الدراسة نمذجة سابقة توليدية لحركة مشهد مساحة الصورة، أي حركة جميع وحدات البكسل في صورة واحدة. يتم تدريب النموذج على مسارات الحركة المستخرجة تلقائيًا من مجموعة كبيرة من تسلسلات الفيديو الحقيقية. مشروطًا بصورة مدخلة، يتنبأ النموذج المدرب بنسيج حركة عشوائية عصبية: مجموعة من معاملات أساس الحركة التي تميز مسار كل بكسل في المستقبل.

يكمن أساس هذا الابتكار في نموذج تم تدريبه بدقة. يتعلم نموذج جوجل من مجموعة بيانات واسعة من مسارات الحركة المستخرجة من تسلسلات فيديو حقيقية تتميز بحركة طبيعية متذبذبة. تتضمن هذه التسلسلات مشاهد تحتوي على عناصر مثل تأرجح الأشجار، وحركة الزهور، ووميض الشموع، وتطاير الملابس في مهب الريح. تتيح مجموعة البيانات المتنوعة هذه للنموذج فهم نطاق واسع من السلوكيات الديناميكية.

يقتصر نطاق الدراسة على مشاهد العالم الحقيقي ذات الديناميكيات الطبيعية المتذبذبة، مثل الأشجار والزهور التي تتحرك في مهب الريح. يتم اختيار سلسلة فورييه لتكون الوظائف الأساسية. يمكن بعد ذلك تحويل نسيج التردد الناتج إلى مسارات حركة بكسل كثيفة وطويلة المدى، والتي يمكن استخدامها لتجميع الإطارات المستقبلية، وتحويل الصور الثابتة إلى رسوم متحركة واقعية.

عندما قدمت مع أ صورة واحدة، يستخدم النموذج المدرب عملية أخذ عينات الانتشار المنسقة بالتردد. تتنبأ هذه العملية بتمثيل حركة طويل المدى لكل بكسل في مجال فورييه، يُطلق عليه نسيج الحركة العشوائية العصبية. يتم بعد ذلك تحويل هذا التمثيل إلى مسارات حركة كثيفة تمتد عبر مقطع فيديو بأكمله. إلى جانب وحدة العرض المستندة إلى الصور، يمكن تسخير هذه المسارات في العديد من التطبيقات العملية.

بالمقارنة مع البادئات على بكسلات RGB الخام، تلتقط البادئات على الحركة بنية أكثر أساسية وأقل أبعادًا تشرح الاختلافات في قيم البكسل بكفاءة. يؤدي هذا إلى إنشاء أكثر تماسكًا على المدى الطويل وتحكمًا أكثر دقة في الرسوم المتحركة مقارنة بالطرق السابقة التي تؤدي الصورة المتحركة عبر تركيب الفيديو الخام.

يعد تمثيل الحركة المولدة مناسبًا لعدد من التطبيقات النهائية، مثل إنشاء مقاطع فيديو متكررة سلسة، وتحرير الحركة المولدة، وتمكين التفاعلية صور ديناميكية، ومحاكاة استجابة ديناميكيات الكائن للقوى التي يطبقها المستخدم.

اقرأ المزيد من الموضوعات ذات الصلة:

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

المزيد من المقالات
دامير يالالوف
دامير يالالوف

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

Hot Stories
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

من Ripple إلى The Big Green DAO: كيف تساهم مشاريع العملة المشفرة في الأعمال الخيرية

دعونا نستكشف المبادرات التي تستغل إمكانات العملات الرقمية لأغراض خيرية.

لمعرفة المزيد

AlphaFold 3 وMed-Gemini وآخرون: الطريقة التي يغير بها الذكاء الاصطناعي الرعاية الصحية في عام 2024

يتجلى الذكاء الاصطناعي بطرق مختلفة في مجال الرعاية الصحية، بدءًا من الكشف عن الارتباطات الجينية الجديدة وحتى تمكين الأنظمة الجراحية الروبوتية...

لمعرفة المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
من Ripple إلى The Big Green DAO: كيف تساهم مشاريع العملة المشفرة في الأعمال الخيرية
تحليل الأداء التشفير Wiki باقة الأعمال التعليم أسلوب الحياة الأسواق تطبيقات الكمبيوتر تكنولوجيا
من Ripple إلى The Big Green DAO: كيف تساهم مشاريع العملة المشفرة في الأعمال الخيرية
13 مايو 2024
AlphaFold 3 وMed-Gemini وآخرون: الطريقة التي يغير بها الذكاء الاصطناعي الرعاية الصحية في عام 2024
AI Wiki تحليل الأداء استوعب مراجعة باقة الأعمال الأسواق تقرير الأخبار تطبيقات الكمبيوتر قصص ومراجعات تكنولوجيا
AlphaFold 3 وMed-Gemini وآخرون: الطريقة التي يغير بها الذكاء الاصطناعي الرعاية الصحية في عام 2024
13 مايو 2024
Nim Network تطرح إطار عمل ترميز ملكية الذكاء الاصطناعي وتجري بيع العائدات مع تحديد تاريخ اللقطة في مايو
الأسواق تقرير الأخبار تكنولوجيا
Nim Network تطرح إطار عمل ترميز ملكية الذكاء الاصطناعي وتجري بيع العائدات مع تحديد تاريخ اللقطة في مايو
13 مايو 2024
Binance تتعاون مع الأرجنتين لمكافحة الجرائم الإلكترونية
مراجعة باقة الأعمال الأسواق تقرير الأخبار تطبيقات الكمبيوتر تكنولوجيا
Binance تتعاون مع الأرجنتين لمكافحة الجرائم الإلكترونية
13 مايو 2024
CRYPTOMERIA LABS PTE. المحدودة.