新聞報導 專業技術
2022 年 11 月 23 日

Text-to-SVG:伯克利宣布抽象基於像素的擴散模型

簡單來說

文本到圖像合成——加州大學伯克利分校的研究人員展示了帶有文本條件的矢量圖形 擴散模型

在文本到圖像的合成中,擴散模型有 證明 傑出的成果。 擴散模型學習使用龐大的帶註釋圖片數據庫生成極其多樣化的對象和情況的光柵圖像。 然而,對於數字圖標、圖形和貼紙,設計人員通常使用圖像的矢量表示,例如可縮放矢量圖形 (SVG)。 矢量圖形很小,可以縮放到任意大小。

Text-to-SVG:伯克利宣布抽象基於像素的擴散模型

加州大學伯克利分校演示瞭如何使用在圖片像素表示上訓練的文本條件擴散模型生成可以導出為 SVG 的矢量圖形。 它在不使用大量帶字幕的 SVG 集合的情況下實現了這一點。 相反,伯克利的研究人員將一個 文本到圖像擴散 採樣並使用得分蒸餾採樣損失對其進行微調,其動機是最近在文本到 3D 合成方面的工作。

示例生成的向量

查看新生成的 SVG 畫廊 点击這裡.

矢量圖形很小,但在縮放到任何大小時都能保持清晰度。 伯克利的研究人員改進了基於分數蒸餾採樣的圖像文本損失以優化矢量圖形。 VectorFusion 使用的 DiffVG 可微分 SVG 渲染器使逆向視覺成為可能。

此外,VectorFusion 允許更有效和更高質量的多級配置。 該方法首先從 文本到圖像的擴散模型 被稱為 Stable Diffusion。 然後,VectorFusion 使用 LIVE 自動跟踪樣本。 然而,這些示例經常缺乏細節、乏味或難以適應矢量圖形。 通過分數蒸餾採樣增強活力和文本一致性。

VectorFusion 可以通過將 SVG 路徑限制為網格上的正方形來生成舊視頻遊戲風格的像素藝術。

這種方法很容易擴展以支持文本到草圖的生成。 為了學習準確表示用戶提供的文本的抽象線條圖,我們首先繪製 16 個隨機選擇的筆劃。 然後,我們優化我們的潛在分數蒸餾採樣損失。

閱讀相關文章:

免責聲明

在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。

關於作者

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

更多文章
達米爾亞拉洛夫
達米爾亞拉洛夫

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

Hot Stories

Galxe 與 Jambo 合作擴大全球可及性 Web3

by 艾莉莎戴維森
2024 年 5 月 02 日
加入我們的時事通訊。
最新消息

Galxe 與 Jambo 合作擴大全球可及性 Web3

by 艾莉莎戴維森
2024 年 5 月 02 日

宣判日到來:美國法院考慮司法部的認罪,CZ 的命運懸而未決

趙長鵬將於今日在西雅圖的美國法院接受宣判。

了解更多

Samourai Wallet 創辦人被指控在暗網交易中協助 2 億美元

Samourai 錢包創始人的被捕對整個行業來說是一個顯著的挫折,凸顯了持續的...

了解更多
加入我們的創新技術社區
了解更多
阅读更多
Pantera Capital 投資 TON 區塊鏈,對 Telegram 擴大加密貨幣可近性的潛力充滿信心
購物 新聞報導 專業技術
Pantera Capital 投資 TON 區塊鏈,對 Telegram 擴大加密貨幣可近性的潛力充滿信心
2024 年 5 月 2 日
Mitosis 從 Amber Group 和 Foresight Ventures 籌集了 7 萬美元資金,以推進其模組化流動性協議
購物 新聞報導 專業技術
Mitosis 從 Amber Group 和 Foresight Ventures 籌集了 7 萬美元資金,以推進其模組化流動性協議
2024 年 5 月 2 日
Galxe 與 Jambo 合作擴大全球可及性 Web3
購物 新聞報導 專業技術
Galxe 與 Jambo 合作擴大全球可及性 Web3
2024 年 5 月 2 日
谷歌的 Med-Gemini 準備搶先機 GPT-4 憑藉其在醫療保健領域的卓越表現
AI Wiki 最新消息 軟體 專業技術
谷歌的 Med-Gemini 準備搶先機 GPT-4 憑藉其在醫療保健領域的卓越表現
2024 年 5 月 2 日