تقدم Google ديناميكيات الصور التوليدية المبتكرة التي تحاكي المشاهد الديناميكية في الصور الثابتة
كشفت شركة جوجل عن ديناميات الصورة التوليدية، نهج جديد يتيح تحويل أ صورة ثابتة واحدة في فيديو حلقات سلس أو مشهد ديناميكي تفاعلي يقدم مجموعة واسعة من التطبيقات العملية.
في قلب هذه التقنية الرائدة توجد نمذجة مساحة الصورة قبل ديناميكيات المشهد. الهدف هو خلق فهم شامل لكيفية تصرف الأشياء والعناصر الموجودة في الصورة عند تعرضها لتفاعلات ديناميكية مختلفة. يمكن بعد ذلك استخدام هذا الفهم لمحاكاة استجابة ديناميكيات الكائن لتفاعلات المستخدم بشكل فعال.
الميزة الرئيسية لهذه التقنية هي القدرة على إنشاء مقاطع فيديو متكررة بشكل سلس. ومن خلال الاستفادة من ديناميكيات مساحة الصورة السابقة على المشهد، يستطيع نظام Google استقراء وتوسيع حركة العناصر داخل الصورة، وتحويلها إلى حلقة فيديو آسرة ومستمرة. تفتح هذه الوظيفة العديد من الإمكانيات الإبداعية لمنشئي المحتوى ومصمميه.
تتيح هذه التقنية للمستخدمين التفاعل مع الكائنات داخل الصور الثابتة بشكل واقعي. من خلال محاكاة استجابة ديناميكيات الكائن لإثارة المستخدم، يسمح نظام Google بذلك تجارب غامرة وتفاعلية ضمن الصور. وهذا لديه القدرة على إحداث ثورة مساحات ميتافيرس وكيفية تفاعل المستخدمين مع المحتوى المرئي.
يكمن أساس هذا الابتكار في نموذج تم تدريبه بدقة. يتعلم نموذج جوجل من مجموعة بيانات واسعة من مسارات الحركة المستخرجة من تسلسلات فيديو حقيقية تتميز بحركة طبيعية متذبذبة. تتضمن هذه التسلسلات مشاهد تحتوي على عناصر مثل تأرجح الأشجار، وحركة الزهور، ووميض الشموع، وتطاير الملابس في مهب الريح. تتيح مجموعة البيانات المتنوعة هذه للنموذج فهم نطاق واسع من السلوكيات الديناميكية.
عندما قدمت مع أ صورة واحدة، يستخدم النموذج المدرب عملية أخذ عينات الانتشار المنسقة بالتردد. تتنبأ هذه العملية بتمثيل حركة طويل المدى لكل بكسل في مجال فورييه، يُطلق عليه نسيج الحركة العشوائية العصبية. يتم بعد ذلك تحويل هذا التمثيل إلى مسارات حركة كثيفة تمتد عبر مقطع فيديو بأكمله. إلى جانب وحدة العرض المستندة إلى الصور، يمكن تسخير هذه المسارات في العديد من التطبيقات العملية.
بالمقارنة مع البادئات على بكسلات RGB الخام، تلتقط البادئات على الحركة بنية أكثر أساسية وأقل أبعادًا تشرح الاختلافات في قيم البكسل بكفاءة. يؤدي هذا إلى إنشاء أكثر تماسكًا على المدى الطويل وتحكمًا أكثر دقة في الرسوم المتحركة مقارنة بالطرق السابقة التي تؤدي الصورة المتحركة عبر تركيب الفيديو الخام.
يعد تمثيل الحركة المولدة مناسبًا لعدد من التطبيقات النهائية، مثل إنشاء مقاطع فيديو متكررة سلسة، وتحرير الحركة المولدة، وتمكين التفاعلية صور ديناميكية، ومحاكاة استجابة ديناميكيات الكائن للقوى التي يطبقها المستخدم.
اقرأ المزيد من الموضوعات ذات الصلة:
إخلاء المسئولية
تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.
نبذة عن الكاتب
دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.
المزيد من المقالاتدامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.