Haber Raporu Teknoloji
Eylül 19, 2023

Google, Statik Görüntülerdeki Dinamik Sahneleri Simüle Eden Yenilikçi Üretken Görüntü Dinamiklerini Tanıtıyor

Google bir açıklama yaptı Üretken Görüntü DinamikleriYeni bir yaklaşım, bir dönüşümü mümkün kılar tek bir statik görüntüyü kesintisiz döngüsel bir videoya dönüştürün veya çok çeşitli pratik uygulamalar sunan etkileşimli dinamik bir sahne.

Google, Statik Görüntülerdeki Dinamik Sahneleri Simüle Eden Yenilikçi Üretken Görüntü Dinamiklerini Tanıtıyor

Bu öncü teknolojinin temelinde, sahne dinamiklerinden önce bir görüntü alanının modellenmesi yer alır. Amaç, bir görüntüdeki nesnelerin ve öğelerin çeşitli dinamik etkileşimlere maruz kaldıklarında nasıl davranabileceğine dair kapsamlı bir anlayış yaratmaktır. Bu anlayış daha sonra nesne dinamiğinin kullanıcı etkileşimlerine verdiği tepkiyi etkili bir şekilde simüle etmek için kullanılabilir.

Bu teknolojinin temel özelliği kesintisiz döngüsel videolar oluşturma yeteneğidir. Google'ın sistemi, sahne dinamiklerinden önce görüntü alanından yararlanarak bir görüntü içindeki öğelerin hareketini tahmin edebilir ve genişletebilir, böylece onu büyüleyici ve sürekli bir video döngüsüne dönüştürebilir. Bu işlevsellik, içerik yaratıcıları ve tasarımcıları için çok sayıda yaratıcı olanağın önünü açar.

Makale, ağaçlar, çiçekler, mumlar ve rüzgarda uçuşan giysiler gibi doğal, salınımlı hareketler içeren gerçek video dizilerinden çıkarılan bir hareket yörüngeleri koleksiyonundan öğrenilen, sahne dinamiklerine dayalı olarak bir görüntü uzayının önceden modellenmesine yönelik bir yaklaşım sunmaktadır. . Eğitilen model, sinirsel stokastik hareket dokusu adını verdikleri Fourier alanındaki piksel başına uzun vadeli hareket temsilini tahmin etmek için frekans koordineli bir difüzyon örnekleme süreci kullanıyor. Bu gösterim, tüm videoyu kapsayan yoğun hareket yörüngelerine dönüştürülebilir.

Teknoloji, kullanıcıların statik görüntülerdeki nesnelerle gerçekçi bir şekilde etkileşim kurmasını sağlar. Google'ın sistemi, nesne dinamiğinin kullanıcı uyarımına verdiği tepkiyi simüle ederek şunları sağlar: sürükleyici ve etkileşimli deneyimler görüntülerin içinde. Bu devrim yaratma potansiyeline sahip metaveren boşlukları ve kullanıcıların görsel içerikle nasıl etkileşim kurduğu.

Çalışma, görüntü-uzay sahne hareketi, yani tek bir görüntüdeki tüm piksellerin hareketi için üretken bir önselliğin modellenmesini araştırmaktadır. Model, geniş bir gerçek video dizileri koleksiyonundan otomatik olarak çıkarılan hareket yörüngeleri üzerinde eğitilmiştir. Bir girdi görüntüsüne bağlı olarak eğitilen model, sinirsel bir stokastik hareket dokusunu tahmin eder: her pikselin geleceğe yönelik yörüngesini karakterize eden bir hareket temeli katsayıları kümesi.

Bu yeniliğin temeli titizlikle eğitilmiş bir modelde yatmaktadır. Google'ın modeli, doğal, salınımlı hareket içeren gerçek video dizilerinden elde edilen geniş bir hareket yörüngesi veri kümesinden öğreniyor. Bu sekanslar, ağaçların sallanması, çiçeklerin hareket etmesi, mumların titreşmesi ve rüzgarda dalgalanan kıyafetler gibi unsurların yer aldığı sahneleri içerir. Bu çeşitli veri kümesi, modelin çok çeşitli dinamik davranışları anlamasını sağlar.

Çalışmanın kapsamı rüzgarda hareket eden ağaçlar ve çiçekler gibi doğal, salınan dinamiklere sahip gerçek dünya sahneleriyle sınırlıdır. Fourier serisi temel fonksiyonlar olarak seçilmiştir. Ortaya çıkan frekans-uzay dokuları daha sonra yoğun, uzun menzilli piksel hareket yörüngelerine dönüştürülebilir; bu yörüngeler, gelecekteki kareleri sentezlemek ve durağan görüntüleri gerçekçi animasyonlara dönüştürmek için kullanılabilir.

Bir ile sunulduğunda Tek resimeğitilen model, frekans koordineli bir difüzyon örnekleme süreci kullanır. Bu süreç, sinirsel stokastik hareket dokusu olarak adlandırılan, Fourier alanında piksel başına uzun vadeli bir hareket temsilini öngörür. Bu temsil daha sonra tüm videoyu kapsayan yoğun hareket yörüngelerine dönüştürülür. Görüntü tabanlı bir işleme modülüyle birleştiğinde bu yörüngeler çeşitli pratik uygulamalar için kullanılabilir.

Ham RGB pikselleri üzerindeki önceliklerle karşılaştırıldığında, hareket üzerindeki öncelikler, piksel değerlerindeki değişiklikleri verimli bir şekilde açıklayan daha temel, daha düşük boyutlu, boyut altı yapıyı yakalar. Bu, daha önceki yöntemlere kıyasla animasyonlar üzerinde daha tutarlı uzun vadeli üretime ve daha ayrıntılı kontrole yol açar. görüntü animasyonu ham video sentezi yoluyla.

Oluşturulan hareket temsili, kesintisiz döngüsel videolar oluşturma, oluşturulan hareketi düzenleme ve etkileşimi etkinleştirme gibi bir dizi aşağı akış uygulaması için uygundur. dinamik görüntülernesne dinamiğinin kullanıcı tarafından uygulanan kuvvetlere tepkisini simüle eder.

Daha fazla ilgili konu okuyun:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Daha fazla haber
Damir Yalalov
Damir Yalalov

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Volatilite Ortasında Bitcoin ETF'lerine Yönelik Kurumsal İştah Artıyor

13F başvuruları aracılığıyla yapılan açıklamalar, önemli kurumsal yatırımcıların Bitcoin ETF'leriyle uğraştığını ortaya koyuyor ve Bitcoin ETF'lerinin artan bir şekilde kabul edildiğinin altını çiziyor.

bilmek Daha

Hüküm Günü Geliyor: ABD Mahkemesi Adalet Bakanlığı'nın Savunmasını Değerlendirirken CZ'nin Kaderi Dengede

Changpeng Zhao bugün Seattle'daki bir ABD mahkemesinde cezayla karşı karşıya kalmaya hazırlanıyor.

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
Blockchain Yeniliğinden Yararlanmak: Almanya Sağlık Hizmetlerinde Dönüşüm ve Gelişmiş Hasta Bakımına Doğru Cesur Bir Adım Atıyor
Yaşam Tarzı Piyasalar Yazılım Hikayeler ve İncelemeler Teknoloji
Blockchain Yeniliğinden Yararlanmak: Almanya Sağlık Hizmetlerinde Dönüşüm ve Gelişmiş Hasta Bakımına Doğru Cesur Bir Adım Atıyor
Mayıs 13, 2024
Bitcoin Yeniden Alım Platformu BounceBit Mainnet'i Başlattı ve BB Token Tahsisini Duyurdu
Haber Raporu Teknoloji
Bitcoin Yeniden Alım Platformu BounceBit Mainnet'i Başlattı ve BB Token Tahsisini Duyurdu
Mayıs 13, 2024
L3 Blockchain Degen Chain, Kesinti Sorununu Çözmek İçin Altyapı Platformu Kanalıyla Ortak Oluyor
Haber Raporu Teknoloji
L3 Blockchain Degen Chain, Kesinti Sorununu Çözmek İçin Altyapı Platformu Kanalıyla Ortak Oluyor
Mayıs 13, 2024
Parity Çoklu İmza Cüzdanından Bugün 3,050 ETH Aklandı ve 83,017 ETH Hacker Kontrolünde Kaldı, Cyvers Uyarılarını Tespit Ediyor
Piyasalar Haber Raporu Teknoloji
Parity Çoklu İmza Cüzdanından Bugün 3,050 ETH Aklandı ve 83,017 ETH Hacker Kontrolünde Kaldı, Cyvers Uyarılarını Tespit Ediyor
Mayıs 13, 2024
CRYPTOMERIA LABS PTE. LTD.