Google の AI により、XNUMX つの画像で風景を無限に移動できます
簡単に言えば
Google の調査では、単一の画像 (動画) を使用して 3D ビデオを作成する方法が示されています
AI は、包括的でリアルで一貫性のある 3D 環境を構築できます
Google の新しいプロジェクトは、 実証 単一の画像を使用して、現実的な方法で風景の中を移動する AI 生成ビデオを作成できること。 この研究は、鳥の視覚効果からインスピレーションを得た「ビュー合成」と呼ばれる方法に基づいています。 この手法では、ニューラル ネットワークを使用して画像を解析し、そこから深度情報を抽出します。
これにより、アルゴリズムは、カメラが別の位置に移動したかのように、シーンの新しいビューを生成できます。 結果は リアルなビデオ 風景の中を移動する物体または人を示します。
この作品には、将来的に魅力的な潜在的な方向性がたくさんあります。 たとえば、現在、永続的な基礎となる 3D 表現はなく、私たちのアプローチは、前のフレームとその深度マップに応じてシーン コンテンツを合成するだけです。 この研究は、包括的でリアルで一貫性のある 3D 環境を作成できるアルゴリズムの開発を示唆しています。
このテクノロジーの潜在的な用途は無限です。 たとえば、映画やテレビ番組の現実的なロケハンビデオの作成に使用できます。 次の目的にも使用できます リアルな VR 体験を生成する。 これらすべてのスパンと画像をトレーニング データとして使用することで、AI はこの世界を構築しています。
さらに記事を読む:
免責事項
に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。
著者について
Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。
より多くの記事Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。