ニュースレポート テクノロジー
2023 年 4 月 10 日

Stability AI SDXL Betaと呼ばれる新モデルをリリース

簡単に言えば

Stability AI SDXL Beta と呼ばれる新しいモデルをリリースしました (Stable Diffusion XL ベータ)。 これは、より多くのパラメーターといくつかの未知の拡張機能を備えた大規模なモデルです。 DreamStudioで入手可能です。 Stability AIの公式画像ジェネレーターであり、高度なアルゴリズムと深層学習技術を使用して素晴らしいビジュアルを作成します。

Stability AI は、SDXL Beta(略称)と呼ばれる新モデルのプレビューを発表しました。 Stable Diffusion XL ベータ版。 これまでのところ、同社はこのモデルに関する多くの情報を公開していないが、希望する人は誰でもテストすることができる。 この SDXL モデルの新しい点は次のとおりです。 stable diffusion? その利点と欠点は何ですか? 調べてみましょう。

続きを読む: Midjourney および Dall-E アーティスト スタイル ダンプと例: 130 の有名な AI ペイント テクニック

SDXLモデルとは正確には何ですか?

SDXLモデルは現在販売中の新型モデルです 訓練されている. 完成にはほど遠いので、リリースまでには多くの詳細が変更される可能性があります。 私たちが知っている限りでは、それは SDXL モデルと呼ばれることさえないかもしれません。 私たちが知っているのは、それがより多くのパラメーターといくつかの未知の拡張機能を備えたより大きなモデルであることだけです. これは v2 モデルであり、v3 モデルではありません (意味が何であれ)。 v2 モデルの機能強化によってシステムのパフォーマンスが向上する可能性はありますが、詳細な情報がなければ、これらの改善がどれほど重要であるかを判断することは困難です。 さらに、このバージョンで追加または調整された特定のパラメーターを知っておくと役立ちます。

SDXL モデルは現在 DreamStudio で入手可能です。 Stability AIの公式画像ジェネレーター。 モデルメニューから「SDXL Beta」を選択して確認してください。 高度なアルゴリズムを使用しているようで、 ディープラーニング技術 幅広いアプリケーションに最適な見事なビジュアルを作成します。

SDXLモデルとは正確には何ですか?

改善点

読みやすいテキスト。 SDXL は読みやすいテキストを生成できます。これはおそらく、既存の v1 および v2.1 モデルでは不可能だった最も顕著な機能です。 SDXL で生成されたテキストは、次の図でわかるように、必ずしも正確であるとは限りません。 Stable Diffusion 以下のテキスト。 ただし、v2.1 モデルはおろか、v1 よりもはるかに優れています。 これは、SDXL がより高度な深層学習アルゴリズムを使用しており、より複雑な言語構造を理解して生成できるためです。 さらなる開発により、精度と信頼性がさらに高まる可能性があります。

プロンプト: 「No Fakes」と書かれた白い紙を持っている紳士の写真
プロンプト: 「No Fakes」と書かれた白い紙を持っている紳士の写真
「ジョーク禁止」と書かれた白いフォントの黒い看板を持っている赤毛の女性の写真
プロンプト: 「ジョーク禁止」と書かれた白いフォントの黒い看板を持っている赤毛の女性の写真
プロンプト: 「Pain and Plane」という言葉が書かれたプレートを持って映画館に座っている中国人女性の写真。
プロンプト: 「Pain and Plane」という言葉が書かれたプレートを持って映画館に座っている中国人女性の写真。

人間の解剖学. 解剖学的に正しい人物像を正確に生成することは、長い間、科学者にとっての課題でした。 stable diffusion. 四肢の追加または欠落の存在は一般的です。 通常、修復はそれらを修正するために使用されますが、最近では、ControlNet の Open Pose 機能を使用して参照画像からポーズを複製することもできます。 ここが SDXL Beta モデルの改善点であることを嬉しく思います。 SDXL ベータ モデルでは、参照画像からポーズを正確に複製する点で大幅な改善が見られました。 これは、アニメーションやバーチャル リアリティなど、さまざまな用途に役立つツールです。

右手でボールを回しているスポーツウェアを着た女性の写真
プロンプト: スポーツウェアを着た女性が右手でボールを回転させている写真
赤い月の下に座っている少年の写真
プロンプト: 赤い月の下に座っている少年の写真
プロンプト: 写真には、森の中を走っている老人が写っています。

ポートレート スタイル。 SDXL Beta は、写真のように見える優れたポートレートを生成します。これは、バージョン 1.5 からのアップグレードです。 SDXL Beta の改善されたアルゴリズムにより、ポートレートのディテールと色の精度が向上し、より自然でリアルな外観になります。 ユーザーは、シャープネスと彩度のレベルを調整して、目的の効果を実現することもできます。

プロンプト: 男の子と女の子の写真
プロンプト: 男の子と女の子の写真
プロンプト: 太った男のポートレート写真
プロンプト: 太った男のポートレート写真
プロンプト: 80 年代の女性の写真
プロンプト: 80 年代の女性の写真

ダブルトーン。 v1.5 モデルでは、キーワード doubletone は常に白黒写真を生成します。 ただし、現在では、SDXL Beta によって生成されるデュオトーン画像にはさまざまな色があります。 v1 モデルと比較して、以下の機能が向上していることは明らかです。 プロンプトを解釈する が改善され、v2 モデルからの応答がより正確で適切になり、自然言語処理タスクにとってより信頼できるツールになりました。

ダブルトーン スタイルの犬のポートレート
プロンプト: 犬のダブルトーン スタイルの肖像画
島のダブルトーン風景
プロンプト: 島のダブルトーン風景
アフリカの若い女性のダブルトーンの肖像画
プロンプト: アフリカの若い女性のダブルトーンの肖像画

芸術的なスタイル。 いくつかの小さな調整が加えられていますが、新しいモデルが単にユニークであるため、新しいモデルがより良い結果を提供するかどうかを判断するのは困難です。 これらの調整は個人的な好みや主観的な意見の問題である可能性があり、調整が困難になる可能性があります。 defi品質に対する客観的な判断。 それにもかかわらず、調整の独自性は注目に値するものであり、さらに調査する価値があるかもしれません。

ニューヨーク イヴァン・アイヴァゾフスキー
v 1.5: Ivan Aivazovskyによるニューヨーク
ニューヨーク イヴァン・アイヴァゾフスキー
SDXL: Ivan Aivazovskyによるニューヨーク
クリストファー・バラスカスのオールド・フォレスト
v 1.5: Christopher Balaskas による Old Forest
クリストファー・バラスカスのオールド・フォレスト
SDXL: Christopher Balaskas による Old Forest

まとめ

  • Stable Diffusion ようやく意味のあるテキストを生成できるようになります。
  • SDXL は、v2.1 モデルや (程度は劣りますが) v1.5 モデルよりも美的に魅力的な画像を提供します。
  • 新しいモデルは、より正確な画像を生成します。
  • 人間の解剖学は改善されました。
  • v2.1 ほど否定的なプロンプトは必要ありません。
  • リアルなポートレートを作成できます。
  • モデルのいくつかの奇妙な点は、リリース前に修正されます。

関連記事をもっと読む:

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

より多くの記事
ダミル・ヤラロフ
ダミル・ヤラロフ

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

Hot Stories

BRICS 諸国向けステーブルコイン取引ソリューション

by ヴィクトリア・パルチク
2024 年 5 月 01 日
ニュースレターにご参加ください。
最新ニュース

量刑の日が到来:米国裁判所が司法省の申し立てを検討する中、CZの運命は均衡を保っている

Changpeng Zhao氏は本日、シアトルの米国裁判所で判決を受ける予定である。

詳細を知りたい

Samourai Wallet創設者、ダークネット取引で2億ドルを仲介したとして告発

Samourai Wallet 創設者の懸念は業界にとって顕著な後退を表しており、永続的な問題を浮き彫りにしています。

詳細を知りたい
革新的なテクノロジー コミュニティに参加してください
続きを読む
続きを読む
Ankr、AIブロックチェーンプラットフォームTalus Networkと連携し、AI向けビットコインの流動性を解放
ビジネス ニュースレポート テクノロジー
Ankr、AIブロックチェーンプラットフォームTalus Networkと連携し、AI向けビットコインの流動性を解放
2024 年 5 月 1 日
Binance Labs、ブロックチェーン全体での Facebook の Move 統合を促進するために Movement Labs をサポート
ビジネス ニュースレポート テクノロジー
Binance Labs、ブロックチェーン全体での Facebook の Move 統合を促進するために Movement Labs をサポート
2024 年 5 月 1 日
BRICS 諸国向けステーブルコイン取引ソリューション
ビジネス マーケット ストーリーとレビュー テクノロジー
BRICS 諸国向けステーブルコイン取引ソリューション
2024 年 5 月 1 日
ビットコイン L2 ネットワーク BOB が LayerZero と統合され、機能が強化
ビジネス ニュースレポート テクノロジー
ビットコイン L2 ネットワーク BOB が LayerZero と統合され、機能が強化
2024 年 5 月 1 日
CRYPTOMERIA LABS PTE。 株式会社。