ニュースレポート テクノロジー
2023 年 1 月 24 日

VToonify: 芸術的なポートレート ビデオを生成するためのリアルタイム AI モデル

簡単に言えば

革新的な VToonify フレームワークは、制御された高解像度のポートレート ビデオ スタイルの転送を提供するために、開発者によって開発されました。

見事な芸術的なポートレートを作成するために、このフレームワークは StyleGAN の中解像度レイヤーと高解像度レイヤーを利用します。

既存のStyleGANベースの拡張を可能にします 画像トゥーン化モデル ビデオに。

南洋理工大学の研究者は、 新しいVToonifyフレームワークを導入 制御可能な高解像度のポートレート ビデオ スタイル転送を生成します。 VToonify は、StyleGAN の中解像度レイヤーと高解像度レイヤーを活用して、エンコーダーによって抽出されたマルチスケール コンテンツ機能に基づいて高品質の芸術的なポートレートをレンダリングし、フレームの詳細をより適切に保持します。 実験結果は、私たちのフレームワークが、顔の位置合わせやフレームサイズの制限を必要とせずに、一貫して高品質で望ましい表情を持つビデオを生成できることを示しています。

その結果、さまざまなサイズのビデオで位置合わせされていない顔を受け入れる完全な畳み込みアーキテクチャにより、有機的な動きを備えた完全な顔が生成されます。 VToonify フレームワークは、これらのモデルの魅力的な機能を継承して、色と強度の柔軟なスタイル コントロールを実現します。 既存の StyleGAN ベースの画像トゥーン化モデルと互換性があり、それらをビデオトゥーン化に拡張します。 この作業では、Toonify と DualStyleGAN に基づいて構築された、コレクションベースと手本ベースのポートレート ビデオ スタイル転送用に、それぞれ VToonify の XNUMX つのインスタンス化を紹介します。

Vtoonify: 芸術的なポートレート ビデオを生成するためのリアルタイム AI モデル

広範な実験的調査結果は、提案された VToonify フレームワークが、優れた品質と時間的に一貫性のある調整可能なスタイル コントロールを備えた芸術的なポートレート映画の制作において、競合するアプローチよりも優れていることを示しています。 小切手 GitHubの のガイドをご参照ください。

関連記事: OpenAI ビデオ用の AI モデルの作成に取り組んでいます

制御可能な高解像度のポートレート ビデオ スタイル転送を提供するために、VToonify は画像変換フレームワークと StyleGAN ベースのフレームワークの利点を組み合わせています。

(A) 可変入力サイズをサポートするために、画像変換システムは完全な畳み込みネットワークを使用します。 とはいえ、ゼロから教える場合、高解像度で制御されたスタイルを与えることは困難です。

(B) StyleGAN ベースのフレームワークは、固定された画像サイズと細部の損失のみをサポートし、事前トレーニング済みの StyleGAN モデルを使用して、高解像度で制御可能なスタイル転送を行います。

(C) 画像変換フレームワークに似た完全な畳み込みエンコーダー ジェネレーター アーキテクチャを作成するために、ハイブリッド システムは、固定サイズの入力機能と低解像度レイヤーを削除することで StyleGAN を拡張します。

フレームの詳細を保持するために、開発者はエンコーダーをトレーニングして、追加のコンテンツ条件として入力フレームからマルチスケール コンテンツ機能を抽出します。 VToonify は、StyleGAN モデルのスタイル コントロールの柔軟性を継承し、それをジェネレーターに入れてデータとモデルの両方を抽出します。

Vtoonify: 芸術的なポートレート ビデオを生成するためのリアルタイム AI モデル
関連記事: Lambda Labs は、最大 XNUMX つの画像を結合できる AI 画像ミキサーを発表しました

VToonify フレームワークは、現在の StyleGAN ベースの画像トゥーニフィケーション モデルから柔軟なスタイル制御の魅力的な特性を継承しており、これらのモデルと互換性を持って拡張できます。 ビデオ トゥーニフィケーション。 当社の VToonify は、StyleGAN 基盤として DualStyleGAN モデルを使用して以下を提供します。

  • 手本ベースの構造からのスタイルの転送。
  • スタイル度の変更;
  • 模範に基づくカラー スタイルの転送。
Vtoonify: 芸術的なポートレート ビデオを生成するためのリアルタイム AI モデル
StyleGAN 蒸留の場合、開発者は 2 つのバックボーンである Toonify と DualStyleGAN、および高解像度の画像から画像への変換ベースライン Pix2pixHD を比較します。 VToonify-T と VToonify-D は、個々のフレームのバックボーンと同じ高品質で視覚的な要素を維持しながら、ビデオ全体をスタイル化するという点で、同等のバックボーンである Toonify と DualStyleGAN よりも優れています。 たとえば、VToonify-T は Toonify に従って、Arcane スタイルの紫の髪などの強力なスタイル効果を課します。 一方、VToonify-D は、顔の特徴をより適切に維持します。 PixXNUMXpixHD には、VToonify-D と比較すると、ちらつきやアーティファクトがあります。

AI について詳しく読む:

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

より多くの記事
ダミル・ヤラロフ
ダミル・ヤラロフ

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

Hot Stories
ニュースレターにご参加ください。
最新ニュース

量刑の日が到来:米国裁判所が司法省の申し立てを検討する中、CZの運命は均衡を保っている

Changpeng Zhao氏は本日、シアトルの米国裁判所で判決を受ける予定である。

詳細を知りたい

Samourai Wallet創設者、ダークネット取引で2億ドルを仲介したとして告発

Samourai Wallet 創設者の懸念は業界にとって顕著な後退を表しており、永続的な問題を浮き彫りにしています。

詳細を知りたい
革新的なテクノロジー コミュニティに参加してください
続きを読む
続きを読む
AltLayer がステーキング イニシアチブの第 2 フェーズに入り、reALT トークンを導入
マーケット ニュースレポート テクノロジー
AltLayer がステーキング イニシアチブの第 2 フェーズに入り、reALT トークンを導入
2024 年 5 月 2 日
BNBチェーンが1年第2024四半期レポートを発表、価値損失が55.8%削減され、BSC TVLが70.8%急騰していることを強調
マーケット ニュースレポート テクノロジー
BNBチェーンが1年第2024四半期レポートを発表、価値損失が55.8%削減され、BSC TVLが70.8%急騰していることを強調
2024 年 5 月 2 日
ネイバーとカカオのカイア:アジアの新たなブロックチェーン大国が世界の暗号通貨市場を破壊する構え
ビジネス ソフトウェア ストーリーとレビュー テクノロジー
ネイバーとカカオのカイア:アジアの新たなブロックチェーン大国が世界の暗号通貨市場を破壊する構え
2024 年 5 月 2 日
Aave LabsがAave V2030プロトコルの立ち上げを含む「Aave 4」提案を発表
ビジネス ニュースレポート テクノロジー
Aave LabsがAave V2030プロトコルの立ち上げを含む「Aave 4」提案を発表
2024 年 5 月 2 日
CRYPTOMERIA LABS PTE。 株式会社。