ニュースレポート テクノロジー
2022 年 11 月 23 日

Text-to-SVG: Berkeley は、ピクセルベースの拡散モデルの抽象化を発表しました

簡単に言えば

テキストから画像への合成 – カリフォルニア大学バークレー校の研究者は、テキスト条件付きのベクター グラフィックスを示しています。 拡散モデル

テキストから画像への合成では、拡散モデルは 実証 優れた成果。 拡散モデルは、注釈付きの写真の膨大なデータベースを使用して、非常に多様なオブジェクトや状況のラスター イメージを生成することを学習します。 ただし、デジタル アイコン、グラフィック、およびステッカーの場合、デザイナーは通常、スケーラブル ベクター グラフィックス (SVG) などの画像のベクター表現を使用します。 ベクター グラフィックスは小さく、任意のサイズに拡大縮小できます。

Text-to-SVG: Berkeley は、ピクセルベースの拡散モデルの抽象化を発表しました

UC Berkeley は、画像ピクセル表現でトレーニングされたテキスト調整拡散モデルを使用して、SVG としてエクスポートできるベクター グラフィックスを生成する方法を示しています。 キャプション付きの SVG の広範なコレクションを使用せずにこれを実現します。 代わりに、バークレーの研究者は テキストから画像への拡散 テキストから3Dへの合成に関する最近の研究に動機付けられたスコア蒸留サンプリング損失でサンプリングして微調整します。

生成されたベクトルの例

新しく生成された SVG ギャラリーをチェックしてください こちら.

ベクター グラフィックスは小さいですが、任意のサイズに拡大縮小してもシャープさを維持します。 Berkeley の研究者は、Score Distillation Sampling に基づいて画像とテキストの損失を改善し、ベクター グラフィックスを最適化します。 VectorFusion で使用される DiffVG 微分可能 SVG レンダラーは、逆のビジュアルを可能にします。

さらに、VectorFusion では、より効果的で高品質な多段階構成が可能です。 この方法は、ラスター サンプルを テキストから画像への拡散モデル 呼ばれます Stable Diffusion。 その後、サンプルは LIVE を使用して VectorFusion によって自動的にトレースされます。 それにもかかわらず、これらのサンプルは、詳細が欠けていたり、退屈であったり、ベクター グラフィックスに適応することが困難であることがよくあります。 スコア蒸留サンプリングを通じて活気とテキストの一貫性を強化します。

VectorFusion は、SVG パスをグリッド上の正方形に制限することで、古いビデオ ゲームのスタイルでピクセル アートを作成できます。

このアプローチは、テキストからスケッチへの生成をサポートするように簡単に拡張できます。 ユーザーが入力したテキストを正確に表す抽象的な線画を学習するために、まず、ランダムに選択された 16 のストロークを描画します。 次に、潜在的なスコア蒸留サンプリング損失を最適化します。

関連記事を読む:

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

より多くの記事
ダミル・ヤラロフ
ダミル・ヤラロフ

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

Hot Stories

Galxe が Jambo と提携して世界的なアクセシビリティを拡大 Web3

by アリサ・デビッドソン
2024 年 5 月 02 日
ニュースレターにご参加ください。
最新ニュース

Galxe が Jambo と提携して世界的なアクセシビリティを拡大 Web3

by アリサ・デビッドソン
2024 年 5 月 02 日

量刑の日が到来:米国裁判所が司法省の申し立てを検討する中、CZの運命は均衡を保っている

Changpeng Zhao氏は本日、シアトルの米国裁判所で判決を受ける予定である。

詳細を知りたい

Samourai Wallet創設者、ダークネット取引で2億ドルを仲介したとして告発

Samourai Wallet 創設者の懸念は業界にとって顕著な後退を表しており、永続的な問題を浮き彫りにしています。

詳細を知りたい
革新的なテクノロジー コミュニティに参加してください
続きを読む
続きを読む
パンテラ・キャピタルがTONブロックチェーンに投資、暗号通貨へのアクセスを広げるテレグラムの可能性に自信を表明
ビジネス ニュースレポート テクノロジー
パンテラ・キャピタルがTONブロックチェーンに投資、暗号通貨へのアクセスを広げるテレグラムの可能性に自信を表明
2024 年 5 月 2 日
Mitosis がモジュラー流動性プロトコルを推進するために Amber Group と Foresight Ventures から 7 万ドルの資金を調達
ビジネス ニュースレポート テクノロジー
Mitosis がモジュラー流動性プロトコルを推進するために Amber Group と Foresight Ventures から 7 万ドルの資金を調達
2024 年 5 月 2 日
Galxe が Jambo と提携して世界的なアクセシビリティを拡大 Web3
ビジネス ニュースレポート テクノロジー
Galxe が Jambo と提携して世界的なアクセシビリティを拡大 Web3
2024 年 5 月 2 日
Google の Med-Gemini が有利なスタートを切る準備が整っている GPT-4 ヘルスケア分野で優れたパフォーマンスを発揮
AI Wiki ニュース ソフトウェア テクノロジー
Google の Med-Gemini が有利なスタートを切る準備が整っている GPT-4 ヘルスケア分野で優れたパフォーマンスを発揮
2024 年 5 月 2 日
CRYPTOMERIA LABS PTE。 株式会社。