Laporan Berita Teknologi
September 19, 2023

Google Memperkenalkan Dinamik Imej Generatif Inovatif Yang Mensimulasikan Adegan Dinamik dalam Imej Statik

Google telah memperkenalkan a Dinamik Imej Generatif, pendekatan baru membolehkan transformasi a imej statik tunggal ke dalam video gelung yang lancar atau pemandangan dinamik interaktif, menawarkan pelbagai aplikasi praktikal.

Google Memperkenalkan Dinamik Imej Generatif Inovatif Yang Mensimulasikan Adegan Dinamik dalam Imej Statik

Teras kepada teknologi perintis ini ialah pemodelan ruang imej sebelum dinamik adegan. Objektifnya adalah untuk mewujudkan pemahaman yang menyeluruh tentang bagaimana objek dan elemen dalam imej mungkin berkelakuan apabila tertakluk kepada pelbagai interaksi dinamik. Pemahaman ini kemudiannya boleh digunakan untuk mensimulasikan tindak balas dinamik objek kepada interaksi pengguna dengan berkesan.

Ciri utama teknologi ini ialah keupayaan untuk menghasilkan video gelung yang lancar. Dengan memanfaatkan ruang imej sebelum dinamik pemandangan, sistem Google boleh mengekstrapolasi dan memanjangkan gerakan elemen dalam imej, mengubahnya menjadi gelung video yang menawan dan berterusan. Fungsi ini membuka banyak kemungkinan kreatif untuk pencipta kandungan dan pereka bentuk.

Makalah ini membentangkan pendekatan untuk memodelkan ruang imej sebelum ini berdasarkan dinamik adegan, yang dipelajari daripada koleksi trajektori gerakan yang diekstrak daripada urutan video sebenar yang mengandungi gerakan semula jadi, berayun seperti pokok, bunga, lilin dan pakaian yang ditiup angin. . Model terlatih menggunakan proses pensampelan resapan diselaraskan frekuensi untuk meramalkan perwakilan gerakan jangka panjang per piksel dalam domain Fourier, yang mereka panggil tekstur gerakan stokastik saraf. Perwakilan ini boleh ditukar kepada trajektori gerakan padat yang merangkumi keseluruhan video.

Teknologi ini membolehkan pengguna berinteraksi dengan objek dalam imej statik secara realistik. Dengan mensimulasikan tindak balas dinamik objek kepada pengujaan pengguna, sistem Google membenarkan pengalaman yang mendalam dan interaktif dalam imej. Ini berpotensi untuk merevolusikan ruang metaverse dan cara pengguna terlibat dengan kandungan visual.

Kajian ini meneroka pemodelan sebelumnya generatif untuk gerakan pemandangan ruang imej, iaitu, gerakan semua piksel dalam satu imej. Model ini dilatih pada trajektori gerakan yang diekstrak secara automatik daripada koleksi besar jujukan video sebenar. Dikondisikan pada imej input, model terlatih meramalkan tekstur gerakan stokastik saraf: satu set pekali asas gerakan yang mencirikan setiap trajektori piksel ke masa hadapan.

Asas inovasi ini terletak pada model yang terlatih dengan teliti. Model Google belajar daripada set data besar trajektori gerakan yang diekstrak daripada jujukan video sebenar yang menampilkan gerakan semula jadi dan berayun. Urutan ini termasuk adegan dengan unsur seperti pokok bergoyang, bunga bergerak, lilin berkelip dan pakaian berkepul-kepul ditiup angin. Set data yang pelbagai ini membolehkan model memahami julat luas gelagat dinamik.

Skop kajian terhad kepada adegan dunia sebenar dengan dinamik semula jadi, berayun, seperti pokok dan bunga yang bergerak mengikut angin. Siri Fourier dipilih sebagai fungsi asas. Tekstur ruang frekuensi yang terhasil kemudiannya boleh diubah menjadi trajektori gerakan piksel jarak jauh yang padat, yang boleh digunakan untuk mensintesis bingkai masa hadapan, menukar imej pegun menjadi animasi realistik.

Apabila dibentangkan dengan a Imej tunggal, model terlatih menggunakan proses persampelan resapan diselaraskan frekuensi. Proses ini meramalkan perwakilan gerakan jangka panjang per piksel dalam domain Fourier, yang dipanggil tekstur gerakan stokastik saraf. Perwakilan ini kemudiannya diubah menjadi trajektori gerakan padat yang merangkumi keseluruhan video. Ditambah dengan modul pemaparan berasaskan imej, trajektori ini boleh dimanfaatkan untuk pelbagai aplikasi praktikal.

Berbanding dengan prior atas piksel RGB mentah, prior over motion menangkap lebih asas, struktur bawah dimensi lebih rendah yang menerangkan variasi dalam nilai piksel dengan cekap. Ini membawa kepada penjanaan jangka panjang yang lebih koheren dan kawalan yang lebih halus ke atas animasi berbanding kaedah terdahulu yang berprestasi. animasi imej melalui sintesis video mentah.

Perwakilan gerakan yang dijana adalah mudah untuk beberapa aplikasi hiliran, seperti mencipta video gelung yang lancar, mengedit gerakan yang dihasilkan dan mendayakan interaktif imej dinamik, mensimulasikan tindak balas dinamik objek kepada daya yang digunakan pengguna.

Baca lebih banyak topik berkaitan:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Dari Ripple kepada The Big Green DAO: Bagaimana Projek Mata Wang Kripto Menyumbang kepada Amal

Mari kita terokai inisiatif yang memanfaatkan potensi mata wang digital untuk tujuan amal.

Mengetahui lebih lanjut

AlphaFold 3, Med-Gemini, dan lain-lain: The Way AI Transforms Healthcare in 2024

AI menjelma dalam pelbagai cara dalam penjagaan kesihatan, daripada mendedahkan korelasi genetik baharu kepada memperkasakan sistem pembedahan robotik ...

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Lebih Lanjut
Maklumat Lanjut
Dari Ripple kepada The Big Green DAO: Bagaimana Projek Mata Wang Kripto Menyumbang kepada Amal
Analisis Crypto Wiki Perniagaan Pendidikan Gaya hidup pasaran perisian Teknologi
Dari Ripple kepada The Big Green DAO: Bagaimana Projek Mata Wang Kripto Menyumbang kepada Amal
Semoga 13, 2024
AlphaFold 3, Med-Gemini, dan lain-lain: The Way AI Transforms Healthcare in 2024
AI Wiki Analisis Digest Pendapat Perniagaan pasaran Laporan Berita perisian Cerita dan Ulasan Teknologi
AlphaFold 3, Med-Gemini, dan lain-lain: The Way AI Transforms Healthcare in 2024
Semoga 13, 2024
Rangkaian Nim Untuk Melancarkan Rangka Kerja Tokenisasi Pemilikan AI Dan Menjalankan Jualan Hasil Dengan Tarikh Syot Kilat Dijadualkan Untuk Mei
pasaran Laporan Berita Teknologi
Rangkaian Nim Untuk Melancarkan Rangka Kerja Tokenisasi Pemilikan AI Dan Menjalankan Jualan Hasil Dengan Tarikh Syot Kilat Dijadualkan Untuk Mei
Semoga 13, 2024
Binance Bekerjasama dengan Argentina untuk Membanteras Jenayah Siber
Pendapat Perniagaan pasaran Laporan Berita perisian Teknologi
Binance Bekerjasama dengan Argentina untuk Membanteras Jenayah Siber
Semoga 13, 2024