谷歌推出創新的生成影像動力學,可在靜態影像中模擬動態場景
谷歌推出了一款 生成圖像動力學,一種新穎的方法可以實現 將單一靜態影像轉換為無縫循環視頻 或互動式動態場景,提供廣泛的實際應用。
這項開創性技術的核心是先於場景動態對影像空間進行建模。 目標是全面了解圖像中的物件和元素在經歷各種動態互動時的行為。 這種理解可以用來有效地模擬物件動態對使用者互動的回應。
該技術的主要特點是能夠產生無縫循環影片。 透過利用場景動力學之前的圖像空間,Google的系統可以推斷和擴展圖像中元素的運動,將其轉變為迷人的連續視訊循環。 此功能為內容創作者和設計者開啟了許多創意可能性。
該技術使用戶能夠與靜態圖像中的物件進行逼真的互動。 透過模擬物體動力學對用戶激勵的反應,谷歌的系統可以 沉浸式與互動體驗 在圖像內。 這有可能徹底改變 元宇宙空間 以及使用者如何與視覺內容互動。
這項創新的基礎在於精心訓練的模式。 谷歌的模型從大量運動軌跡資料集中進行學習,這些軌跡是從具有自然振盪運動特徵的真實視訊序列中提取的。 這些序列包括樹木搖曳、花朵移動、蠟燭閃爍、衣服在風中飄揚等元素的場景。 這種多樣化的資料集使模型能夠理解廣泛的動態行為。
當出現 單張圖片,訓練後的模型採用頻率協調擴散取樣過程。 這個過程預測傅立葉域中的每像素長期運動表示,稱為神經隨機運動紋理。 然後,該表示被轉換為跨越整個影片的密集運動軌跡。 與基於影像的渲染模組相結合,這些軌跡可用於各種實際應用。
與原始 RGB 像素的先驗相比,運動捕捉的先驗更基本、更低維度的低維度結構,可以有效解釋像素值的變化。 與之前執行的方法相比,這可以實現更連貫的長期生成和對動畫更細微的控制 影像動畫 透過原始影片合成。
生成的運動表示對於許多下游應用程式來說很方便,例如創建無縫循環影片、編輯生成的運動以及啟用互動式 動態圖像,模擬物體動力學對使用者施加的力的反應。
閱讀更多相關主題:
免責聲明
在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。
關於作者
Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。
更多文章Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。