Yangiliklar hisoboti texnologiya
Sentyabr 19, 2023

Google Statik tasvirlardagi dinamik sahnalarni taqlid qiluvchi innovatsion generativ tasvir dinamikasini taqdim etadi

Google kompaniyasini taqdim etdi Generativ tasvir dinamikasi, yangi yondashuv a ni o'zgartirishga imkon beradi yagona statik tasvirni uzluksiz aylanishli videoga aylantiring yoki keng ko'lamli amaliy ilovalarni taklif qiluvchi interaktiv dinamik sahna.

Google Statik tasvirlardagi dinamik sahnalarni taqlid qiluvchi innovatsion generativ tasvir dinamikasini taqdim etadi

Ushbu kashshof texnologiyaning asosi sahna dinamikasidan oldin tasvir maydonini modellashtirishdir. Maqsad - turli xil dinamik o'zaro ta'sirlarga duchor bo'lganda, tasvir ichidagi ob'ektlar va elementlarning o'zini qanday tutishi haqida keng qamrovli tushuncha yaratish. Keyinchalik bu tushuncha ob'ekt dinamikasining foydalanuvchi o'zaro ta'siriga javobini simulyatsiya qilish uchun ishlatilishi mumkin.

Ushbu texnologiyaning asosiy xususiyati uzluksiz aylanishli videolarni yaratish qobiliyatidir. Sahna dinamikasidan oldingi tasvir maydonidan foydalangan holda, Google tizimi tasvir ichidagi elementlarning harakatini ekstrapolyatsiya qilish va kengaytirish, uni jozibali va uzluksiz video tsikliga aylantirishi mumkin. Ushbu funksiya kontent yaratuvchilari va dizaynerlari uchun ko'plab ijodiy imkoniyatlarni ochib beradi.

Maqolada daraxtlar, gullar, shamlar va shamolda esadigan kiyimlar kabi tabiiy, tebranuvchi harakatni o'z ichiga olgan haqiqiy video ketma-ketliklaridan olingan harakat traektoriyalari to'plamidan o'rganilgan sahna dinamikasiga asoslangan tasvir maydonini modellashtirishga yondashuv keltirilgan. . O'qitilgan model, Furye domenida piksel boshiga uzoq muddatli harakat ko'rinishini bashorat qilish uchun chastota bilan muvofiqlashtirilgan diffuziya namuna olish jarayonidan foydalanadi, ular buni neyron stoxastik harakat teksturasi deb atashadi. Ushbu tasvir butun videoni qamrab oladigan zich harakat traektoriyalariga aylantirilishi mumkin.

Texnologiya foydalanuvchilarga statik tasvirlar ichidagi ob'ektlar bilan real tarzda muloqot qilish imkonini beradi. Ob'ekt dinamikasining foydalanuvchi qo'zg'alishiga javobini simulyatsiya qilish orqali Google tizimi bunga imkon beradi immersiv va interaktiv tajribalar tasvirlar ichida. Bu inqilob qilish imkoniyatiga ega metavers bo'shliqlar va foydalanuvchilar vizual kontent bilan qanday shug'ullanishi.

Tadqiqot tasvir-fazoviy sahna harakati uchun generativ oldingi modellashtirishni, ya'ni bitta tasvirdagi barcha piksellarning harakatini o'rganadi. Model haqiqiy video ketma-ketliklarining katta to'plamidan avtomatik ravishda olingan harakat traektoriyalari bo'yicha o'qitiladi. Kirish tasviriga ko'ra, o'qitilgan model neyron stoxastik harakat teksturasini bashorat qiladi: har bir pikselning kelajakka traektoriyasini tavsiflovchi harakat asosining koeffitsientlari to'plami.

Ushbu innovatsiyaning asosi puxta o'qitilgan modelda yotadi. Google modeli tabiiy, tebranish harakatini aks ettiruvchi haqiqiy video ketma-ketliklardan olingan harakat traektoriyalarining katta ma'lumotlar to'plamidan o'rganadi. Bu ketma-ketliklarga daraxtlarning chayqalishi, gullarning harakatlanishi, shamlarning miltillashi va shamolda uchayotgan kiyimlar kabi elementlar mavjud. Ushbu xilma-xil ma'lumotlar to'plami modelga dinamik xatti-harakatlarning keng doirasini tushunishga imkon beradi.

Tadqiqot doirasi shamolda harakatlanadigan daraxtlar va gullar kabi tabiiy, tebranuvchi dinamikaga ega haqiqiy dunyo sahnalari bilan cheklangan. Bazis funksiyalar sifatida Furye qatori tanlanadi. Olingan chastota-kosmik teksturalar keyinchalik zich, uzoq masofali pikselli harakat traektoriyalariga aylantirilishi mumkin, ular kelajakdagi kadrlarni sintez qilish, harakatsiz tasvirlarni real animatsiyalarga aylantirish uchun ishlatilishi mumkin.

A bilan taqdim etilganda bitta rasm, o'qitilgan model chastota bilan muvofiqlashtirilgan diffuziya namuna olish jarayonini qo'llaydi. Bu jarayon neyron stoxastik harakat teksturasi deb ataladigan Furye domenida har bir pikselga uzoq muddatli harakat namoyishini bashorat qiladi. Keyinchalik bu tasvir butun videoni qamrab oluvchi zich harakat traektoriyalariga aylantiriladi. Tasvirga asoslangan renderlash moduli bilan birgalikda ushbu traektoriyalar turli amaliy ilovalar uchun ishlatilishi mumkin.

Xom RGB piksellar bilan solishtirganda, harakatga nisbatan ustunlar piksel qiymatlaridagi o'zgarishlarni samarali tushuntirib beradigan asosiy, pastki o'lchamli kichik o'lchamli tuzilmani oladi. Bu animatsiyalarni amalga oshiradigan oldingi usullarga nisbatan ko'proq izchil uzoq muddatli yaratishga va yanada nozik nazoratga olib keladi. tasvir animatsiyasi xom video sintezi orqali.

Yaratilgan harakat namoyishi bir qator quyi oqim ilovalari uchun qulaydir, masalan, uzluksiz aylanishli videolarni yaratish, yaratilgan harakatni tahrirlash va interaktiv rejimlarni yoqish. dinamik tasvirlar, ob'ekt dinamikasining foydalanuvchi tomonidan qo'llaniladigan kuchlarga javobini simulyatsiya qilish.

Ko'proq tegishli mavzularni o'qing:

Masʼuliyatdan voz kechish

Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.

Muallif haqida

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi. 

Boshqa maqolalar
Damir Yalolov
Damir Yalolov

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi. 

Hot Stories
Bizning xabarnomamizga qo'shiling.
So'nggi yangiliklar

Ripple'dan Katta Yashil DAOga: Kriptovalyuta loyihalari xayriyaga qanday hissa qo'shadi

Raqamli valyutalarning potentsialidan xayriya maqsadlarida foydalanish tashabbuslarini ko'rib chiqaylik.

Ko'proq ma'lumot oling

AlphaFold 3, Med-Gemini va boshqalar: AI 2024 yilda sog'liqni saqlashni o'zgartiradi.

AI sog'liqni saqlash sohasida turli yo'llar bilan namoyon bo'ladi, yangi genetik korrelyatsiyalarni ochishdan robotli jarrohlik tizimlarini kuchaytirishgacha ...

Ko'proq ma'lumot oling
Innovatsion texnologiyalar hamjamiyatimizga qo'shiling
Ko'proq o'qing
Ko'proq o'qing
Ripple'dan Katta Yashil DAOga: Kriptovalyuta loyihalari xayriyaga qanday hissa qo'shadi
Tahlil Kripto Wiki ish ta'lim Hayot tarzi Birja Dastur texnologiya
Ripple'dan Katta Yashil DAOga: Kriptovalyuta loyihalari xayriyaga qanday hissa qo'shadi
, 13 2024 mumkin
AlphaFold 3, Med-Gemini va boshqalar: AI 2024 yilda sog'liqni saqlashni o'zgartiradi.
AI Wiki Tahlil Digestalar fikr ish Birja Yangiliklar hisoboti Dastur Hikoyalar va sharhlar texnologiya
AlphaFold 3, Med-Gemini va boshqalar: AI 2024 yilda sog'liqni saqlashni o'zgartiradi.
, 13 2024 mumkin
Nim Network AI egalik tokenizatsiyasi tizimini ishlab chiqaradi va may oyiga rejalashtirilgan snapshot sanasi bilan rentabellikni sotadi
Birja Yangiliklar hisoboti texnologiya
Nim Network AI egalik tokenizatsiyasi tizimini ishlab chiqaradi va may oyiga rejalashtirilgan snapshot sanasi bilan rentabellikni sotadi
, 13 2024 mumkin
Binance Argentina bilan kiberjinoyatchilikka qarshi hamkorlik qiladi
fikr ish Birja Yangiliklar hisoboti Dastur texnologiya
Binance Argentina bilan kiberjinoyatchilikka qarshi hamkorlik qiladi
, 13 2024 mumkin
CRYPTOMERIA LABS PTE. LTD.