ニュースレポート
2022 年 11 月 06 日

ERNIE-ViLG 2.0: Baidu の新しいテキストから画像へのモデルは、Dalle-2 や Stable Diffusion

簡単に言えば

Dale-2 と Stable Diffusion ERNIE-ViLG 2.0 よりも大幅に優れたパフォーマンスを示しました

アーニー・ヴィルグ2.0 Dalle-2 よりも優れたパフォーマンスを提供するテキストから画像へのモデルです。 Stable Diffusion、現在利用可能なテキストから画像への最も人気のある XNUMX つのモデル。 新しいモデルは、Baidu の研究者チームによって設計およびトレーニングされ、その結果は驚くべきものでした。

新しいテキストから画像へのモデル ERNIE-ViLG 2.0 は、Dalle-2 よりも優れたパフォーマンスを発揮します。 Stable Diffusion
ERNIE-ViLG 2.0で作成した画像

結果は、ERNIE-ViLG 2.0 が Dalle-2 を大幅に上回り、 Stable Diffusion。 これは重要な成果であり、ERNIE フレームワークの威力を示しています。 の Metaverse Post チームは ERNIE-ViLG 2.0 と Stable Diffusion 以下:

アーニー・ヴィルグ2.0
Stable Diffusion
アーニー・ヴィルグ2.0
Stable Diffusion
アーニー・ヴィルグ2.0
Stable Diffusion
アーニー・ヴィルグ2.0
Stable Diffusion
アーニー・ヴィルグ2.0

これらの結果は、ERNIE-ViLG 2.0 がより効果的であるという仮説を強力に裏付けています。 Dalle-2 と両方よりもテキストから画像へのシステム Stable Diffusion.

Unet アーキテクチャ Stable Diffusion を基本としますが、次のように変更します。

  • ノイズ除去専門家の混合: 10 つではなく XNUMX のニューラル ネットワークがあり、それぞれが特定の拡散ステップのみを担当します。
  • テキストの知識: キーワードがより重み付けされるように、クエリ内の単語の重み付けが自動的に変更されました。
  • 視覚的な知識: トレーニング中、中間生成結果でオブジェクトが検出され、オブジェクトのある領域の損失関数の重みが増加しました。

その結果、世界最大の テキストから画像へのモデル モデルをトレーニングするために、24 億個のパラメーター (SD の 10 倍) を用意しました。

以前のモデルと比較して、ERNIE-ViLG 2.0 は、ViLG-300 バイリンガルで同時にテストした場合、画質と画像とテキストのマッチングの点でそれらを大幅に上回っています。 プロンプト 人によって設定されました。

プロンプトは、中国語から英語に自動的に翻訳されます。 抱き合う顔 AI に送信される前の公開デモ。 多くの機能はこれから流れます。

  • ERNIE は国際的な著名人を知りません。 たとえば、ERNIE はアーノルド・シュワルツェネッガーを知りません。 それは確かに中国で地元のお気に入りを持っています.
  • その結果、プロンプトに有名人の名前を使用する方法は、プロンプトの品質を劇的に向上させます。 失敗します。
  • 中国語からの翻訳のため、多少の歪みが予想されるため、中国語を話せない場合は、いくつかの驚きがあるかもしれません.
  • Greg Rutkowski については何も知りません。

関連記事を読む:

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

より多くの記事
ダミル・ヤラロフ
ダミル・ヤラロフ

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

Hot Stories

BRICS 諸国向けステーブルコイン取引ソリューション

by ヴィクトリア・パルチク
2024 年 5 月 01 日
ニュースレターにご参加ください。
最新ニュース

量刑の日が到来:米国裁判所が司法省の申し立てを検討する中、CZの運命は均衡を保っている

Changpeng Zhao氏は本日、シアトルの米国裁判所で判決を受ける予定である。

詳細を知りたい

Samourai Wallet創設者、ダークネット取引で2億ドルを仲介したとして告発

Samourai Wallet 創設者の懸念は業界にとって顕著な後退を表しており、永続的な問題を浮き彫りにしています。

詳細を知りたい
革新的なテクノロジー コミュニティに参加してください
続きを読む
続きを読む
Ankr、AIブロックチェーンプラットフォームTalus Networkと連携し、AI向けビットコインの流動性を解放
ビジネス ニュースレポート テクノロジー
Ankr、AIブロックチェーンプラットフォームTalus Networkと連携し、AI向けビットコインの流動性を解放
2024 年 5 月 1 日
Binance Labs、ブロックチェーン全体での Facebook の Move 統合を促進するために Movement Labs をサポート
ビジネス ニュースレポート テクノロジー
Binance Labs、ブロックチェーン全体での Facebook の Move 統合を促進するために Movement Labs をサポート
2024 年 5 月 1 日
BRICS 諸国向けステーブルコイン取引ソリューション
ビジネス マーケット ストーリーとレビュー テクノロジー
BRICS 諸国向けステーブルコイン取引ソリューション
2024 年 5 月 1 日
ビットコイン L2 ネットワーク BOB が LayerZero と統合され、機能が強化
ビジネス ニュースレポート テクノロジー
ビットコイン L2 ネットワーク BOB が LayerZero と統合され、機能が強化
2024 年 5 月 1 日
CRYPTOMERIA LABS PTE。 株式会社。