ControlNet で画像モーフィング アニメーションを生成する方法
以前の実験により 指揮するd. モーフィングに ControlNet を使用するという考えがありました。 その後、ControlNet ではなく、深度マップから画像を作成できる depth2img モデルの使用に切り替えました。 また、ControlNet は詳細に機能するだけではありません。 このポスト テクニックに関する詳細情報があります。
手続きの流れを簡単に紹介します。 img2img で画像を生成する場合、生成中のステップ数に影響を与えるノイズ除去強度オプションを使用できます。 たとえば、ステップ = 30 でノイズ除去強度 = 0.5 の場合、作成するステップは 15 ステップしか残っていません。 この推論は、モーフのアニメーション化に適用できます。 任意の画像を変形できます。 ポートレートだけができるわけではありません。
元の写真を撮ります。 画像ボックスを空白のままにして、ControlNet をアクティブにします。 ランダム テストを生成するには、シードを -1 に選択します。 バッチ数はその量に影響します。 ガイダンス パラメータ、受け取ったカードの重量、および ControlNet モードを試すことができます。 生成が気に入ったら、マウスで img2img にドラッグし、このプロセスを繰り返して、最終的に 1 番目の画像になる画像を探します。 すべての画像が完成すると、アニメーションをどのように作成するかという問題が生じます。 (最初は、余分な写真を作成しないように、バッチ カウントを XNUMX に設定することを忘れないでください。)
ここでは興味深いソリューションを使用しますが、その欠点については後で説明します。
XYZ プロットが使用されます。 スクリプト リストから選択する必要があります。 最終的なイメージだけでなく、元のイメージからのトランジションも作成できます。
X の値を次の行に入力します。
0.0.296.0.39.0.459.0.515.0.563.0.606.0.644.0.68.0.713.0.743.0.772.0.799.0.825.0.85.0.874.0.897.0.919.0.94.0.961.
これは、生成が開始されると、21 つではなく XNUMX 個の画像 (コンマで区切られた値の数) を受け取ることを意味します。 なぜこの行があるのですか? たとえば、表示が異なる場合があります。
この形式を使用すると、理解しやすくなります。自動化された 20 枚の画像を要求し、ノイズ除去が 0 から 1 の範囲の値の結果にどのように影響するかを示すように依頼します。0.5 番目のオプションの欠点は、値が線形に変化することです。 、ノイズ除去の特性上、リアルなモーフィングには見えません。 ゼロに近い数字は、結果にほとんど影響を与えません。 XNUMX を超えるレベルでは、非常に顕著に影響し始めます。
その結果、最初の行はタイプ x.4、つまり x を 0.4 上げた曲線になります。 直線の線形関数と、より正確な出力を生成する曲線関数が、画像で対比されています。 ブレンダーを使用して、このような文字列を作成できます。
ラインを作成する前に、トランジションのフレーム数を選択する必要があります。 プロジェクト設定で編集可能です。
明細を取得するには、複数の手順を実行する必要があります。 まず、曲線の形状を試します。 これを行うには、アニメーション パラメータのコンテキスト メニューから [キーフレームの削除] を選択します。
曲線を取得する式は次のとおりです。 パラメーターが青色に変わり、ドライバーがその中で動作していることを示します。
ここで値をいじることができます。 4. ただし、低くなりすぎないようにします。 frame/21 は、フレーム 0 からフレーム 1 までの 0 から 21 への値のシフトを示します。1 から 20 フレームの間の値だけが残されます。
とはいえ、キーはドライバーではありません。 それらは最初に準備する必要があります。 これを行うには、3D ウィンドウで Object > Animation > Bake Action をクリックし、OK をクリックします。
ただし、これはオブジェクトの可能なすべてのキーに影響するため、削除する必要があります。 最初の行を除くすべてを選択し、キーボードの X を押します (マウスはリストの下にあるはずです)。
次に、画面左側の行を取得するには、[再生] をクリックしてコンソール ウィンドウを開きます。
コピーできる文字列を取得しました。
アニメーションを作成するには、最初に作成した各画像位置に対してこのプロセスを個別に実行し、ビデオ エディターでアニメーションに組み立てる必要があります。
はい、プロセスはまだ自動化されていませんが、すべてを完全にカスタマイズできます。 生成モデルと ControlNet モデルとモードを変更したり、前処理を有効または無効にしたり、その他好きなことを行うことができます。 主なことは、良い結果を失わず、すべてを正しく繰り返してアニメーションを作成することです。
テクノロジーの欠点 — 移行のための土台をたくさん築くべきではありません。 上記で、ノイズ除去がステップ数に影響することを書きました。 いくつかのノイズ除去値が同じステップ数内にあるため、出力が画像を複製することが判明する場合があります。 それらの数は、自動コンソールで確認できます。
このテクノロジーは、インターポレーター リターダーと組み合わせて使用できます。つまり、アニメーションを送信して欠落しているフレームを完成させることができます。 これにより、よりスムーズな変化が得られます。
関連記事をもっと読む:
免責事項
に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。
著者について
Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。
より多くの記事Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。