テキストからビデオへのモデル Gen-2 は、テキスト プロンプトを使用して短いビデオを生成できます
簡単に言えば
RunWayML の新しい Text2Video モデル Gen-2 は、既存の要素を編集できるだけでなく、 ビデオ テキスト プロンプトのみを使用して、新しいプロンプトを最初から生成することもできます。
この機能により、人々がソーシャル メディア プラットフォームでコンテンツを作成および共有する方法が改善され、ユーザーの変革が可能になることが期待されています。 静的な画像を動的な画像に変換する ビデオ編集の予備知識がなくても、魅力的なビデオ クリップを作成できます。
Runway の新しいテキストからビデオへのモデル Gen-2 は、既存のビデオを編集できるだけでなく、テキスト プロンプトのみを使用して新しいビデオをゼロから生成することもできます。 これは、既存のビデオしか編集できなかった以前のバージョンの Gen から大幅に改善されています。 テキストからビデオへのモデル Gen-2 は、Runway の最先端の AI テクノロジを利用して、人間が作成したビデオと見分けがつかないビデオを作成します。 この新機能により、ユーザーはビデオ編集の高度なスキルを必要とせずにビデオを自動的に生成することで、時間と労力を節約できます。
新しい Gen-2 モデルは、アップロードされた画像を 短いビデオ クリップ。 これは、ユーザーがビデオに望む内容を説明するテキスト ヒントを提供することによって行われます。 これまでのところ、ビデオの長さは数秒を超えませんが、品質はすでに競合他社のものよりもはるかに高くなっています(特に競合他社の ニューラルネットワーク 一般公開されていません)。 この機能により、人々がソーシャル メディア プラットフォームでコンテンツを作成および共有する方法が改善されることが期待されています。 Gen-2 モデルを使用すると、ユーザーは静止画像を動的ビデオ クリップに簡単に変換できます。 Facebook や Tiktok がこのテクノロジーを使用して、コンテンツ クリエイターが利用できる AI ツールのセットを拡張する可能性は十分にあります。
AIビデオレースはワイルドです。 Gen-1 の発売からちょうど 2 週間が経過し、Gen-XNUMX はすでに発売されています。 最先端の AI ビデオ技術を開発するためのテクノロジー企業間の競争は急速に激化しており、各企業は他の企業をしのぐために努力しています。
Gen の新しいバージョンを試すには、次のキューにサインアップする必要があります。 滑走路のウェブサイト.
- 人工知能スタートアップのランウェイは、 Gen-1を発表、プロンプトと画像を組み合わせることで古いビデオを新しいビデオに変えることができるニューラル ネットワークです。 Gen-1 を使用すると、映画製作者は、 画像またはテキストのプロンプト ソースビデオの構造に合わせます。 Runway Research は、新しい形の創造性を可能にするマルチモーダル AI システムの構築に注力しており、Gen-1 はストーリーテリングの未来を実験するために使用できます。
- 先月、共同創設者兼CEOのサム・アルトマンは、 OpenAI、最近TechCrunchと話し、次のように述べました。 OpenAI 開発中です 動画の AI モデル および GPT-4、会社がその信頼性と安全性を確認した後、一般に公開されます。
- XNUMX月、Googleは一連のビデオに基づいてテキスト条件付きビデオを作成する方法であるImagen Videoを開発した。 拡散モデル。 システムはテキストによる説明を受け入れ、16 x 24 ピクセルの解像度で 48 秒あたり 128 フレームの速度で 24 フレームのムービーを生成します。 システムは余分なフレームをスケーリングして「予測」し、720 秒あたり 1280 フレーム、解像度 768p (14×XNUMX) で XNUMX フレームの最終ビデオを作成します。 Imagen Video のトレーニングには、XNUMX 万の画像とテキストのペアと XNUMX 万のビデオとテキストのペアが使用されました。
関連記事をもっと読む:
免責事項
に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。
著者について
Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。
より多くの記事Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。