2023 年 2 月 08 日

Gen-1：AI 通過結合提示和圖像從現有視頻生成新視頻

發布日期：08 年 2023 月 3 日上午 13:08 更新日期：2023 年 3 月 13 日上午 XNUMX:XNUMX

簡單來說

Gen-1 是一種神經網絡，可以通過組合現有視頻來生成新視頻提示和圖像.

它還可以用於從頭開始創建全新的視頻。

從現有視頻生成新視頻的能力有許多潛在的應用。

人工智能初創公司 RunWayML，已公佈一種名為 Gen-1 的新產品，一種神經網絡，可以通過結合提示和圖像從現有視頻中生成新視頻。多年來，神經網絡一直局限於風格轉換的任務，即拍攝一張圖像並將另一張圖像的風格應用到它的過程。這就是我們如何獲得那些迷幻的深度學習風格遷移視頻，例如，以梵高的星夜風格渲染風景。

Gen-1：AI 通過結合提示和圖像從現有視頻生成新視頻 — @Midjourney /那個奇怪的鬼魂

現在，有了 Gen-1，神經網絡可以做的不僅僅是風格轉換。它可以使用提示和圖像作為輸入從頭開始生成新視頻。這開闢了全新的可能性範圍人工智能創建的視頻. 目前，Gen-1 生成的視頻短小精悍。但隨著技術的發展，我們可以期待看到更複雜和人工智能生成的逼真視頻.

推薦帖子： 通過在虛擬現實中觀看成人視頻改善男性的生殖健康

什麼是 Gen-1？

文字引導解鎖強大的圖片創作和編輯工具生成擴散模型. 雖然這些已應用於視頻的創建，但目前用於編輯現有材料的內容同時保持其結構的方法需要對每個輸入進行昂貴的再培訓，或者依賴於幀之間圖片更改的風險傳播。

開發人員描述了一種以結構和內容為導向的視頻傳播模型，該模型根據對所需結果的書面或視覺描述來改變電影。由於解耦不充分，用戶提供的內容修改和結構表示之間會出現衝突。他們證明，結構和內容的完整性可以通過對具有不同細節層次的單眼深度估計進行訓練來控制。

通過將圖像或文本提示的構圖和風格應用於源視頻的結構，以逼真且一致的方式合成新視頻。這就像在沒有實際拍攝任何東西的情況下拍攝新事物。

將圖像或提示的風格轉移到視頻的每一幀是統一項目、賦予其總體視覺主題並保持一致性的好方法。

通過使用軟件和創意設計，可以將模型轉化為美觀的交互式渲染圖，將用戶的願景變為現實。

借助視頻編輯功能，可以輕鬆分離視頻的各個部分並使用文本提示對其進行增強。

應用輸入影像或提示無紋理渲染可以大大提高其真實感，使 3D 模型栩栩如生。

Runway Research 致力於構建多模態 AI 系統，以實現新形式的創造力。 Gen-1 代表了我們在這一使命中向前邁出的又一關鍵步驟。如果您是一名創意人士，希望嘗試講故事的未來，請在下方申請訪問權限。

Gen-1 還可用於從頭開始創建全新的視頻。它可以用於多種目的，包括創建現有電影的新版本或完全創建新電影。這個消息肯定會讓電影製作人和其他一直在尋找新方法來突破其藝術界限的創意人士興奮不已。有了 Gen-1，他們現在擁有了一個新的強大工具供他們使用。

的能力生成新視頻來自現有的有許多潛在的應用。例如，它可用於創建現有視頻內容的新版本，因此它可用於創建可能過於昂貴或邏輯上難以拍攝的場景或鏡頭的替代版本。

您可以在 Beta 測試期間申請使用該模型請點擊這裡.

閱讀有關人工智能的更多信息：

標籤：

免責聲明

在與線信託專案指南，請注意，本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。重要的是，僅投資您可以承受損失的金額，並在有任何疑問時尋求獨立的財務建議。如需了解更多信息，我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告，但市場狀況如有變更，恕不另行通知。

關於作者

Damir 是團隊領導、產品經理和編輯 Metaverse Post，涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。他的文章每月吸引超過一百萬用戶的大量讀者。他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。達米爾獲得了物理學學士學位，他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。