Gen-1: AI は、プロンプトと画像を組み合わせて既存の動画から新しい動画を生成します
簡単に言えば
Gen-1 は、既存のビデオを組み合わせて新しいビデオを生成できるニューラル ネットワークです。 プロンプトと画像.
また、まったく新しいビデオをゼロから作成するためにも使用できます。
既存のビデオから新しいビデオを生成する機能には、多くの潜在的なアプリケーションがあります。
人工知能のスタートアップである RunWayML は、 発表しました Gen-1 と呼ばれる新製品は、プロンプトと画像を組み合わせて既存のビデオから新しいビデオを生成できるニューラル ネットワークです。 何年もの間、ニューラル ネットワークはスタイル転送のタスクに限定されてきました。これは、画像を取得して別の画像のスタイルを適用するプロセスです。 これは、たとえば風景がヴァン ゴッホの星月夜のスタイルでレンダリングされる、トリッピーなディープ ラーニング スタイルの転送ビデオを取得する方法です。
現在、Gen-1 により、ニューラル ネットワークは単なるスタイル転送以上のことを行うことができます。 プロンプトと画像を入力として使用して、新しいビデオをゼロから生成できます。 これにより、まったく新しい可能性の範囲が開かれます AI作成動画。 現時点では、Gen-1 によって生成されたビデオは短くてシンプルです。 しかし、テクノロジーが発展するにつれて、より複雑で複雑なものが登場することが予想されます。 AIが生成するリアルな映像.
Gen-1とは何ですか?
強力な画像作成および編集ツールは、テキストガイドによってロック解除されます 生成拡散モデル. これらはビデオの作成に適用されていますが、その構造を維持しながら既存の素材のコンテンツを編集する現在の方法は、入力ごとに高価な再トレーニングを必要とするか、フレーム間の画像変更の危険な伝播に依存しています。
開発者は、構造とコンテンツに誘導されたビデオ拡散のモデルを説明します。これは、望ましい結果の書面または視覚的な説明に基づいて映画を変更します。 デカップリングが不十分なため、ユーザー提供のコンテンツの変更と構造表現の間で競合が発生します。 彼らは、構造とコンテンツの完全性が、さまざまな詳細レベルでの単眼深度推定のトレーニングによって制御される可能性があることを示しています。
画像またはテキスト プロンプトの構成とスタイルをソース ビデオの構造に適用することにより、リアルで一貫した方法で新しいビデオを合成します。 実際には何も撮影せずに、何か新しいものを撮影するようなものです。
画像またはプロンプトのスタイルをビデオのすべてのフレームに移すことは、プロジェクトを統一し、全体的な視覚的テーマを与え、一貫性を生み出す優れた方法です。
ソフトウェアとクリエイティブなデザインを使用することで、モックアップを美的に魅力的でインタラクティブなレンダリングに変換し、ユーザーのビジョンに命を吹き込むことができます。
ビデオ編集機能を使用すると、ビデオの一部を簡単に分離し、テキスト プロンプトで強化できます。
入力画像を適用するか、 プロンプト テクスチャなしのレンダリングを使用すると、リアリズムが大幅に向上し、3D モデルに命を吹き込むことができます。
Runway Research は、新しい形の創造性を可能にするマルチモーダル AI システムの構築に専念しています。 Gen-1 は、このミッションにおける重要な前進のもう XNUMX つを表しています。 ストーリーテリングの未来を試してみたいクリエイティブな方は、以下からアクセスをリクエストしてください。
Gen-1 を使用して、まったく新しいビデオをゼロから作成することもできます。 既存の映画の新しいバージョンを作成したり、新しい映画をまとめて作成したりするなど、さまざまな目的に使用できます。 このニュースは、芸術の限界を押し広げる新しい方法を常に模索している映画製作者やその他のクリエイターを興奮させることでしょう。 Gen-1 により、新しい強力なツールを自由に使用できるようになりました。
能力 新しいビデオを生成する 既存のものから多くの潜在的なアプリケーションがあります。 たとえば、既存のビデオ コンテンツの新しいバージョンを作成するために使用できるため、費用がかかりすぎたり、撮影が困難なシーンやショットの代替バージョンを作成するために使用できます。
ベータテスト中のモデルの使用を申請できます こちら.
AI について詳しく読む:
免責事項
に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。
著者について
Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。
より多くの記事Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。