新聞報導
2022 年 10 月 06 日

谷歌通過推出新的文本到視頻 AI 生成器 Imagen Video 來克服 Meta 

簡單來說

谷歌的 Imagen Video 試圖幫助視頻生成器變成殺手級應用

沒過多久,Google 就對 Meta 的 Make-a-Video 做出了回應。 通過使用文本提示, 影像視頻 可能會製作精彩的視頻。 儘管存在許多缺點,但結果比現有技術有了巨大進步。

與 Facebook 的文本到視頻 AI 生成器相比 製作一段視頻,結果明顯更好。 然而,這一戰略也需要更多的監督。 與 Imagen Video 相比,Micro workers 努力用書面描述來註釋電影,Make-a-Scene 使用未標記的視頻進行訓練。

深入了解架構的細節是沒有意義的; 你應該在文章中閱讀它 請點擊這裡. 我們只能確認 T16 編碼器的文本嵌入首先以 5×48 的分辨率以每秒 24 幀的速度生成 3 幀,然後通過多個擴散模型將其放大為 128 幀的最終電影1280×768 和每秒 24 幀。

Imagen視頻是什麼?

Imagen Video 是一種基於一系列視訊擴散模型創建文字條件視訊的方法。 Imagen Video 製作高品質影片 文字提示 透過將基本影片製作模型與一系列交錯的空間和時間影片超解析度模型相結合。 回顧團隊在將系統擴展為高階系統時所做的設計選擇defi文本到視頻模型的定義,包括 v 參數化擴散模型的決策以及特定分辨率下全卷積時間和空間超分辨率模型的選擇。 此外,它還驗證了早期基於擴散的圖像生成工作的結果並將其應用到 視頻生成。 然後,在無分類器的指導下對視頻模型進行漸進式蒸餾,以實現快速、高質量的採樣。

谷歌研究團隊聲稱該系統接受文本描述並且 生成一個 16 幀的電影 每秒三幀,分辨率為 24 x 48 像素。 系統縮放並“預測”額外的幀,以每秒 128 幀和 24p 分辨率 (720×1280) 創建具有 768 幀的最終視頻。 有 60 萬個圖像文本對和 14 萬個視頻文本對用於訓練 Imagen Video。

圖像視頻樣本

即使僅僅因為使用 AI 製作視頻更快、更便宜,這些技術也無疑會被無處不在。

有興趣閱讀更多嗎? 以下是一些要檢查的其他主題:

免責聲明

在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。

關於作者

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

更多文章
達米爾亞拉洛夫
達米爾亞拉洛夫

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

Hot Stories
加入我們的時事通訊。
最新消息

用於內容創建、影片編輯等的十大免費人工智慧工具

by 維多利亞·帕爾奇克
2024 年 5 月 14 日

從 Ripple 到大型綠色 DAO:加密貨幣專案如何為慈善事業做出貢獻

讓我們探索利用數位貨幣潛力進行慈善事業的措施。

了解更多

AlphaFold 3、Med-Gemini 等:2024 年人工智慧改變醫療保健的方式

人工智慧在醫療保健領域有多種表現形式,從發現新的遺傳相關性到增強機器人手術系統的能力…

了解更多
加入我們的創新技術社區
了解更多
阅读更多
香港證監會警告加密產業的 Deepfake 詐騙:對投資人安全的影響
生活方式 安全性 Wiki 軟體 故事和評論 專業技術
香港證監會警告加密產業的 Deepfake 詐騙:對投資人安全的影響
2024 年 5 月 14 日
Ripple 和 Evmos 合作利用 EvmOS 技術開發 XRP Ledger EVM 側鏈
購物 新聞報導 專業技術
Ripple 和 Evmos 合作利用 EvmOS 技術開發 XRP Ledger EVM 側鏈
2024 年 5 月 14 日
5ireChain發起網路壓力測試激勵“測試網迅雷:GA”,邀請用戶參與 Airdrop 獎勵計劃
新聞報導 專業技術
5ireChain發起網路壓力測試激勵“測試網迅雷:GA”,邀請用戶參與 Airdrop 獎勵計劃
2024 年 5 月 14 日
Stacks 與 Uphold 合作促進無縫資產交易和轉移,促進比特幣的採用
購物 新聞報導 專業技術
Stacks 與 Uphold 合作促進無縫資產交易和轉移,促進比特幣的採用
2024 年 5 月 14 日