ControlNet は完璧なハンドの作成に役立ちます Stable Diffusion 1.5
簡単に言えば
ControlNet は微調整を簡単に行う方法です Stable Diffusion.
これを使用して、SD をより適切に制御するためのモデルを開発できます。
ControlNet はオープンソースであり、WebUI と組み合わせて使用することで、 Stable Diffusion.
テキストから画像への AI ジェネレーターが苦労しているのは、手です。 画像は一般に印象的ですが、手はそれほど印象的ではありません。余分な指、奇妙に曲がった関節、そして AI 側では手がどのように見えるべきかについて明らかに理解していません。 ただし、必ずしもそうである必要はありません。新しい ControlNet 製品が役に立ちます。 Stable Diffusion 完璧でリアルな手を作成します。
ControlNet は、スケッチ、アウトライン、深度、または法線マップを使用して、次の基準に基づいてニューロンをガイドできる新しいテクノロジーです。 Stable Diffusion 1.5. つまり、適切なガイダンスがあれば、どんなカスタム 1.5 モデルでもほぼ完璧に扱えるようになりました。 ControlNet は、ユーザーが設計を究極的に制御できるようにする革新的なツールと考えることができます。
完璧なハンドを実現するには、A1111 エクステンションと ControlNet、特に Depth モジュールを使用します。 次に、手のクローズアップ自撮り写真を数枚撮り、ControlNet UI の txt2img タブにアップロードします。 次に、「幻想的なアートワーク、手のクローズアップを示すバイキングマン」などの単純な夢を形作るプロンプトを作成し、ControlNet の機能を試します。 Depth モジュール、A1111 拡張機能、および ControlNet UI の txt2img タブを試してみると、美しくリアルな手が得られます。
ControlNet 自体は、与えられた画像を深度、法線、またはスケッチに変換して、後でモデルとして使用できるようにします。 もちろん、独自の深度マップやスケッチを直接アップロードすることもできます。 これにより、3D シーンを作成する際の柔軟性が最大限に高まり、最終的なイメージのスタイルと品質に集中することができます。
優れた製品をご覧になることを強くお勧めします ControlNet チュートリアル Aitrepreneur が最近発表したものです。
ControlNet は制御を大幅に改善します Stable Diffusionの画像間機能
しかし Stable Diffusion テキストから画像を作成することもできますが、テンプレートからグラフィックを作成することもできます。 この画像間のパイプラインは、次の目的で頻繁に使用されます。 生成された写真を強化する または、テンプレートを使用してゼロから新しい画像を作成します。
一方、 Stable Diffusion 2.0 は、画像の深度データをテンプレートとして使用する機能を提供しますが、このプロセスの制御はかなり制限されています。 このアプローチは、特にカスタム モデルの数が膨大であるため、以前のバージョン 1.5 ではサポートされていません。バージョン XNUMX は依然として一般的に使用されています。
各ブロックの重みは次のとおりです。 Stable Diffusion ControlNet によってトレーニング可能なバリアントとロックされたバリアントにコピーされます。 ブロックされた形式は、実稼働可能な拡散モデルの機能を維持しますが、トレーニング可能なバリアントは、小さなデータセットを微調整することで画像合成の新しい条件を学習できます。
Stable Diffusion すべての ControlNet モデルで動作し、生成 AI に対する大幅な制御を提供します。 チームは、固定ポーズの人々のいくつかのバリエーションのサンプルと、モデルの空間配置と鳥のイメージのバリエーションに基づいたさまざまなインテリア写真を提供します。
AI について詳しく読む:
免責事項
に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。
著者について
Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。
より多くの記事Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。