Stability AI SDXL Betaと呼ばれる新モデルをリリース
簡単に言えば
Stability AI SDXL Beta と呼ばれる新しいモデルをリリースしました (Stable Diffusion XL ベータ)。 これは、より多くのパラメーターといくつかの未知の拡張機能を備えた大規模なモデルです。 DreamStudioで入手可能です。 Stability AIの公式画像ジェネレーターであり、高度なアルゴリズムと深層学習技術を使用して素晴らしいビジュアルを作成します。
Stability AI は、SDXL Beta(略称)と呼ばれる新モデルのプレビューを発表しました。 Stable Diffusion XL ベータ版。 これまでのところ、同社はこのモデルに関する多くの情報を公開していないが、希望する人は誰でもテストすることができる。 この SDXL モデルの新しい点は次のとおりです。 stable diffusion? その利点と欠点は何ですか? 調べてみましょう。
SDXLモデルとは正確には何ですか?
SDXLモデルは現在販売中の新型モデルです 訓練されている. 完成にはほど遠いので、リリースまでには多くの詳細が変更される可能性があります。 私たちが知っている限りでは、それは SDXL モデルと呼ばれることさえないかもしれません。 私たちが知っているのは、それがより多くのパラメーターといくつかの未知の拡張機能を備えたより大きなモデルであることだけです. これは v2 モデルであり、v3 モデルではありません (意味が何であれ)。 v2 モデルの機能強化によってシステムのパフォーマンスが向上する可能性はありますが、詳細な情報がなければ、これらの改善がどれほど重要であるかを判断することは困難です。 さらに、このバージョンで追加または調整された特定のパラメーターを知っておくと役立ちます。
SDXL モデルは現在 DreamStudio で入手可能です。 Stability AIの公式画像ジェネレーター。 モデルメニューから「SDXL Beta」を選択して確認してください。 高度なアルゴリズムを使用しているようで、 ディープラーニング技術 幅広いアプリケーションに最適な見事なビジュアルを作成します。
改善点
読みやすいテキスト。 SDXL は読みやすいテキストを生成できます。これはおそらく、既存の v1 および v2.1 モデルでは不可能だった最も顕著な機能です。 SDXL で生成されたテキストは、次の図でわかるように、必ずしも正確であるとは限りません。 Stable Diffusion 以下のテキスト。 ただし、v2.1 モデルはおろか、v1 よりもはるかに優れています。 これは、SDXL がより高度な深層学習アルゴリズムを使用しており、より複雑な言語構造を理解して生成できるためです。 さらなる開発により、精度と信頼性がさらに高まる可能性があります。
人間の解剖学. 解剖学的に正しい人物像を正確に生成することは、長い間、科学者にとっての課題でした。 stable diffusion. 四肢の追加または欠落の存在は一般的です。 通常、修復はそれらを修正するために使用されますが、最近では、ControlNet の Open Pose 機能を使用して参照画像からポーズを複製することもできます。 ここが SDXL Beta モデルの改善点であることを嬉しく思います。 SDXL ベータ モデルでは、参照画像からポーズを正確に複製する点で大幅な改善が見られました。 これは、アニメーションやバーチャル リアリティなど、さまざまな用途に役立つツールです。
ポートレート スタイル。 SDXL Beta は、写真のように見える優れたポートレートを生成します。これは、バージョン 1.5 からのアップグレードです。 SDXL Beta の改善されたアルゴリズムにより、ポートレートのディテールと色の精度が向上し、より自然でリアルな外観になります。 ユーザーは、シャープネスと彩度のレベルを調整して、目的の効果を実現することもできます。
ダブルトーン。 v1.5 モデルでは、キーワード doubletone は常に白黒写真を生成します。 ただし、現在では、SDXL Beta によって生成されるデュオトーン画像にはさまざまな色があります。 v1 モデルと比較して、以下の機能が向上していることは明らかです。 プロンプトを解釈する が改善され、v2 モデルからの応答がより正確で適切になり、自然言語処理タスクにとってより信頼できるツールになりました。
芸術的なスタイル。 いくつかの小さな調整が加えられていますが、新しいモデルが単にユニークであるため、新しいモデルがより良い結果を提供するかどうかを判断するのは困難です。 これらの調整は個人的な好みや主観的な意見の問題である可能性があり、調整が困難になる可能性があります。 defi品質に対する客観的な判断。 それにもかかわらず、調整の独自性は注目に値するものであり、さらに調査する価値があるかもしれません。
まとめ
- Stable Diffusion ようやく意味のあるテキストを生成できるようになります。
- SDXL は、v2.1 モデルや (程度は劣りますが) v1.5 モデルよりも美的に魅力的な画像を提供します。
- 新しいモデルは、より正確な画像を生成します。
- 人間の解剖学は改善されました。
- v2.1 ほど否定的なプロンプトは必要ありません。
- リアルなポートレートを作成できます。
- モデルのいくつかの奇妙な点は、リリース前に修正されます。
関連記事をもっと読む:
免責事項
に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。
著者について
Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。
より多くの記事Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。