Google, Statik Görüntülerdeki Dinamik Sahneleri Simüle Eden Yenilikçi Üretken Görüntü Dinamiklerini Tanıtıyor
Google bir açıklama yaptı Üretken Görüntü DinamikleriYeni bir yaklaşım, bir dönüşümü mümkün kılar tek bir statik görüntüyü kesintisiz döngüsel bir videoya dönüştürün veya çok çeşitli pratik uygulamalar sunan etkileşimli dinamik bir sahne.
Bu öncü teknolojinin temelinde, sahne dinamiklerinden önce bir görüntü alanının modellenmesi yer alır. Amaç, bir görüntüdeki nesnelerin ve öğelerin çeşitli dinamik etkileşimlere maruz kaldıklarında nasıl davranabileceğine dair kapsamlı bir anlayış yaratmaktır. Bu anlayış daha sonra nesne dinamiğinin kullanıcı etkileşimlerine verdiği tepkiyi etkili bir şekilde simüle etmek için kullanılabilir.
Bu teknolojinin temel özelliği kesintisiz döngüsel videolar oluşturma yeteneğidir. Google'ın sistemi, sahne dinamiklerinden önce görüntü alanından yararlanarak bir görüntü içindeki öğelerin hareketini tahmin edebilir ve genişletebilir, böylece onu büyüleyici ve sürekli bir video döngüsüne dönüştürebilir. Bu işlevsellik, içerik yaratıcıları ve tasarımcıları için çok sayıda yaratıcı olanağın önünü açar.
Teknoloji, kullanıcıların statik görüntülerdeki nesnelerle gerçekçi bir şekilde etkileşim kurmasını sağlar. Google'ın sistemi, nesne dinamiğinin kullanıcı uyarımına verdiği tepkiyi simüle ederek şunları sağlar: sürükleyici ve etkileşimli deneyimler görüntülerin içinde. Bu devrim yaratma potansiyeline sahip metaveren boşlukları ve kullanıcıların görsel içerikle nasıl etkileşim kurduğu.
Bu yeniliğin temeli titizlikle eğitilmiş bir modelde yatmaktadır. Google'ın modeli, doğal, salınımlı hareket içeren gerçek video dizilerinden elde edilen geniş bir hareket yörüngesi veri kümesinden öğreniyor. Bu sekanslar, ağaçların sallanması, çiçeklerin hareket etmesi, mumların titreşmesi ve rüzgarda dalgalanan kıyafetler gibi unsurların yer aldığı sahneleri içerir. Bu çeşitli veri kümesi, modelin çok çeşitli dinamik davranışları anlamasını sağlar.
Bir ile sunulduğunda Tek resimeğitilen model, frekans koordineli bir difüzyon örnekleme süreci kullanır. Bu süreç, sinirsel stokastik hareket dokusu olarak adlandırılan, Fourier alanında piksel başına uzun vadeli bir hareket temsilini öngörür. Bu temsil daha sonra tüm videoyu kapsayan yoğun hareket yörüngelerine dönüştürülür. Görüntü tabanlı bir işleme modülüyle birleştiğinde bu yörüngeler çeşitli pratik uygulamalar için kullanılabilir.
Ham RGB pikselleri üzerindeki önceliklerle karşılaştırıldığında, hareket üzerindeki öncelikler, piksel değerlerindeki değişiklikleri verimli bir şekilde açıklayan daha temel, daha düşük boyutlu, boyut altı yapıyı yakalar. Bu, daha önceki yöntemlere kıyasla animasyonlar üzerinde daha tutarlı uzun vadeli üretime ve daha ayrıntılı kontrole yol açar. görüntü animasyonu ham video sentezi yoluyla.
Oluşturulan hareket temsili, kesintisiz döngüsel videolar oluşturma, oluşturulan hareketi düzenleme ve etkileşimi etkinleştirme gibi bir dizi aşağı akış uygulaması için uygundur. dinamik görüntülernesne dinamiğinin kullanıcı tarafından uygulanan kuvvetlere tepkisini simüle eder.
Daha fazla ilgili konu okuyun:
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.
Daha fazla haberDamir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.