گزارش خبری پیشرفته
سپتامبر 19، 2023

گوگل دینامیک تصویر مولد خلاقانه ای را معرفی می کند که صحنه های پویا را در تصاویر استاتیک شبیه سازی می کند.

گوگل از یک دینامیک تصویر مولد، یک رویکرد جدید امکان تبدیل a یک تصویر ثابت به یک ویدیوی بدون درز یا یک صحنه پویا تعاملی که طیف گسترده ای از کاربردهای عملی را ارائه می دهد.

گوگل دینامیک تصویر مولد خلاقانه ای را معرفی می کند که صحنه های پویا را در تصاویر استاتیک شبیه سازی می کند.

هسته اصلی این فناوری پیشگام، مدل‌سازی فضای تصویر قبل از دینامیک صحنه است. هدف ایجاد درک جامعی از نحوه رفتار اشیا و عناصر درون یک تصویر هنگام قرار گرفتن در معرض تعاملات پویا مختلف است. سپس می‌توان از این درک برای شبیه‌سازی پاسخ دینامیک شی به تعاملات کاربر استفاده کرد.

ویژگی کلیدی این فناوری توانایی تولید ویدیوهای حلقه ای بدون درز است. با استفاده از فضای تصویر قبل از پویایی صحنه، سیستم گوگل می تواند حرکت عناصر درون یک تصویر را تعمیم داده و گسترش دهد و آن را به یک حلقه ویدئویی جذاب و پیوسته تبدیل کند. این قابلیت، فرصت های خلاقانه متعددی را برای سازندگان و طراحان محتوا باز می کند.

این مقاله رویکردی را برای مدل‌سازی یک تصویر-فضای قبلی بر اساس دینامیک صحنه ارائه می‌کند که از مجموعه‌ای از مسیرهای حرکت استخراج شده از توالی‌های ویدیویی واقعی حاوی حرکت طبیعی و نوسانی مانند درختان، گل‌ها، شمع‌ها و لباس‌هایی که در باد می‌وزند، آموخته می‌شود. . مدل آموزش‌دیده از یک فرآیند نمونه‌برداری انتشار هماهنگ فرکانس برای پیش‌بینی نمایش حرکت بلندمدت در هر پیکسل در حوزه فوریه استفاده می‌کند، که آن‌ها آن را بافت حرکت تصادفی عصبی می‌نامند. این نمایش را می توان به مسیرهای حرکتی متراکم تبدیل کرد که کل یک ویدیو را در بر می گیرد.

این فناوری کاربران را قادر می سازد تا با اشیاء موجود در تصاویر استاتیک به طور واقع بینانه تعامل داشته باشند. سیستم گوگل با شبیه سازی پاسخ دینامیک شی به تحریک کاربر اجازه می دهد تجارب فراگیر و تعاملی درون تصاویر این پتانسیل ایجاد انقلاب را دارد فضاهای متاورس و نحوه تعامل کاربران با محتوای بصری.

این مطالعه به بررسی مدل‌سازی یک پیشین مولد برای حرکت صحنه تصویر-فضا، یعنی حرکت همه پیکسل‌ها در یک تصویر می‌پردازد. این مدل بر روی مسیرهای حرکتی استخراج شده به صورت خودکار از مجموعه بزرگی از دنباله های ویدیویی واقعی آموزش دیده است. مشروط بر یک تصویر ورودی، مدل آموزش‌دیده یک بافت حرکت تصادفی عصبی را پیش‌بینی می‌کند: مجموعه‌ای از ضرایب بر اساس حرکت که مسیر هر پیکسل را در آینده مشخص می‌کند.

پایه و اساس این نوآوری در یک مدل دقیق آموزش دیده نهفته است. مدل گوگل از مجموعه داده گسترده ای از مسیرهای حرکتی استخراج شده از توالی های ویدئویی واقعی که دارای حرکت طبیعی و نوسانی هستند، یاد می گیرد. این سکانس ها شامل صحنه هایی با عناصری مانند تکان خوردن درختان، حرکت گل ها، سوسو زدن شمع ها و وزیدن لباس ها در باد است. این مجموعه داده متنوع، مدل را قادر می سازد تا طیف وسیعی از رفتارهای پویا را درک کند.

دامنه این مطالعه محدود به صحنه های دنیای واقعی با پویایی طبیعی و نوسانی است، مانند درختان و گل ها که در باد حرکت می کنند. سری فوریه به عنوان توابع پایه انتخاب شده است. بافت‌های فرکانس فضایی حاصل می‌توانند به مسیرهای حرکت پیکسلی متراکم و دوربرد تبدیل شوند، که می‌توانند برای ترکیب فریم‌های آینده و تبدیل تصاویر ثابت به انیمیشن‌های واقعی استفاده شوند.

هنگامی که با یک تصویر تکمدل آموزش‌دیده از فرآیند نمونه‌گیری انتشار هماهنگ با فرکانس استفاده می‌کند. این فرآیند یک نمایش حرکت بلندمدت در هر پیکسل را در حوزه فوریه پیش‌بینی می‌کند که بافت حرکت تصادفی عصبی نامیده می‌شود. سپس این نمایش به مسیرهای حرکتی متراکم تبدیل می شود که کل یک ویدیو را در بر می گیرد. همراه با یک ماژول رندر مبتنی بر تصویر، این مسیرها را می توان برای کاربردهای عملی مختلف مهار کرد.

در مقایسه با اولویت‌ها بر پیکسل‌های RGB خام، اولویت‌های بیش از حرکت ساختار زیربعدی بنیادی‌تر و با ابعاد پایین‌تری را به تصویر می‌کشند که به طور موثر تغییرات مقادیر پیکسل را توضیح می‌دهد. این منجر به تولید طولانی‌مدت منسجم‌تر و کنترل دقیق‌تر روی انیمیشن‌ها در مقایسه با روش‌های قبلی می‌شود. انیمیشن تصویر از طریق سنتز ویدیوی خام

نمایش حرکت تولید شده برای تعدادی از برنامه های کاربردی پایین دست، مانند ایجاد ویدیوهای حلقه ای بدون درز، ویرایش حرکت تولید شده، و فعال کردن تعاملی مناسب است. تصاویر پویا، شبیه سازی پاسخ دینامیک شی به نیروهای اعمال شده توسط کاربر.

ادامه مطالب مرتبط را بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

از Ripple تا The Big Green DAO: چگونه پروژه های ارزهای دیجیتال به خیریه کمک می کنند

بیایید طرح‌هایی را بررسی کنیم که از پتانسیل ارزهای دیجیتال برای اهداف خیریه استفاده می‌کنند.

بیشتر بدانید

AlphaFold 3، Med-Gemini، و دیگران: روشی که هوش مصنوعی مراقبت های بهداشتی را در سال 2024 متحول می کند

هوش مصنوعی به روش های مختلفی در مراقبت های بهداشتی ظاهر می شود، از کشف همبستگی های ژنتیکی جدید تا توانمندسازی سیستم های جراحی رباتیک...

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
از Ripple تا The Big Green DAO: چگونه پروژه های ارزهای دیجیتال به خیریه کمک می کنند
تحلیل و بررسی رمزنگاری Wiki کسب و کار آموزش شیوه زندگی بازارها نرم افزار پیشرفته
از Ripple تا The Big Green DAO: چگونه پروژه های ارزهای دیجیتال به خیریه کمک می کنند
ممکن است 13، 2024
AlphaFold 3، Med-Gemini، و دیگران: روشی که هوش مصنوعی مراقبت های بهداشتی را در سال 2024 متحول می کند
AI Wiki تحلیل و بررسی هضم نظر کسب و کار بازارها گزارش خبری نرم افزار داستان ها و نقدها پیشرفته
AlphaFold 3، Med-Gemini، و دیگران: روشی که هوش مصنوعی مراقبت های بهداشتی را در سال 2024 متحول می کند
ممکن است 13، 2024
شبکه Nim چارچوب توکن‌سازی مالکیت هوش مصنوعی را راه‌اندازی می‌کند و فروش بازدهی را با تاریخ Snapshot که برای ماه می برنامه‌ریزی شده است انجام می‌دهد.
بازارها گزارش خبری پیشرفته
شبکه Nim چارچوب توکن‌سازی مالکیت هوش مصنوعی را راه‌اندازی می‌کند و فروش بازدهی را با تاریخ Snapshot که برای ماه می برنامه‌ریزی شده است انجام می‌دهد.
ممکن است 13، 2024
بایننس برای مبارزه با جرایم سایبری با آرژانتین همکاری می کند
نظر کسب و کار بازارها گزارش خبری نرم افزار پیشرفته
بایننس برای مبارزه با جرایم سایبری با آرژانتین همکاری می کند
ممکن است 13، 2024
CRYPTOMERIA LABS PTE. محدود