ERNIE-ViLG 2.0: Baidu の新しいテキストから画像へのモデルは、Dalle-2 や Stable Diffusion
簡単に言えば
Dale-2 と Stable Diffusion ERNIE-ViLG 2.0 よりも大幅に優れたパフォーマンスを示しました
アーニー・ヴィルグ2.0 Dalle-2 よりも優れたパフォーマンスを提供するテキストから画像へのモデルです。 Stable Diffusion、現在利用可能なテキストから画像への最も人気のある XNUMX つのモデル。 新しいモデルは、Baidu の研究者チームによって設計およびトレーニングされ、その結果は驚くべきものでした。
結果は、ERNIE-ViLG 2.0 が Dalle-2 を大幅に上回り、 Stable Diffusion。 これは重要な成果であり、ERNIE フレームワークの威力を示しています。 の Metaverse Post チームは ERNIE-ViLG 2.0 と Stable Diffusion 以下:
これらの結果は、ERNIE-ViLG 2.0 がより効果的であるという仮説を強力に裏付けています。 Dalle-2 と両方よりもテキストから画像へのシステム Stable Diffusion.
Unet アーキテクチャ Stable Diffusion を基本としますが、次のように変更します。
- ノイズ除去専門家の混合: 10 つではなく XNUMX のニューラル ネットワークがあり、それぞれが特定の拡散ステップのみを担当します。
- テキストの知識: キーワードがより重み付けされるように、クエリ内の単語の重み付けが自動的に変更されました。
- 視覚的な知識: トレーニング中、中間生成結果でオブジェクトが検出され、オブジェクトのある領域の損失関数の重みが増加しました。
その結果、世界最大の テキストから画像へのモデル モデルをトレーニングするために、24 億個のパラメーター (SD の 10 倍) を用意しました。
プロンプトは、中国語から英語に自動的に翻訳されます。 抱き合う顔 AI に送信される前の公開デモ。 多くの機能はこれから流れます。
- ERNIE は国際的な著名人を知りません。 たとえば、ERNIE はアーノルド・シュワルツェネッガーを知りません。 それは確かに中国で地元のお気に入りを持っています.
- その結果、プロンプトに有名人の名前を使用する方法は、プロンプトの品質を劇的に向上させます。 顔 失敗します。
- 中国語からの翻訳のため、多少の歪みが予想されるため、中国語を話せない場合は、いくつかの驚きがあるかもしれません.
- Greg Rutkowski については何も知りません。
関連記事を読む:
免責事項
に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。
著者について
Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。
より多くの記事Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。