Ulat sa Balita Teknolohiya
Nobyembre 23, 2022

Text-to-SVG: Inihayag ng Berkeley ang abstracting pixel-based diffusion model

Sa madaling sabi

Text-to-image synthesis – Ang mga mananaliksik ng UC Berkeley ay nagpapakita ng mga vector graphics na may text-conditioned mga modelo ng pagsasabog

Sa text-to-image synthesis, mayroon ang mga diffusion model nagpakita natitirang mga resulta. Natututo ang mga diffusion model na gumawa ng mga raster na larawan ng sobrang magkakaibang mga bagay at sitwasyon gamit ang napakalaking database ng mga annotated na larawan. Gayunpaman, para sa mga digital na icon, graphics, at sticker, ang mga designer ay karaniwang gumagamit ng mga vector representasyon ng mga larawan tulad ng Scalable Vector Graphics (SVGs). Ang mga vector graphics ay maliit at maaaring i-scale sa anumang laki.

Text-to-SVG: Inihayag ng Berkeley ang abstracting pixel-based diffusion model

Ipinapakita ng UC Berkeley kung paano gumawa ng mga vector graphics na maaaring i-export bilang SVG gamit ang isang text-conditioned diffusion model na sinanay sa mga representasyon ng pixel ng larawan. Nagagawa nito ito nang hindi gumagamit ng malawak na koleksyon ng mga SVG na may mga caption. Sa halip, ang mga mananaliksik ng Berkeley ay nag-vector ng isang pagsasabog ng text-to-image sample at i-fine-tune ito gamit ang Score Distillation Sampling loss, na udyok ng kamakailang trabaho sa text-to-3D synthesis.

Halimbawang nabuong mga vector

Tingnan ang bagong nabuong SVG gallery dito.

Ang mga vector graphics ay maliit ngunit pinapanatili ang kanilang sharpness kapag nai-scale sa anumang laki. Pinapabuti ng mga mananaliksik sa Berkeley ang pagkawala ng teksto ng imahe batay sa Score Distillation Sampling upang ma-optimize ang vector graphics. Ang DiffVG differentiable SVG renderer, na ginagamit ng VectorFusion, ay ginagawang posible ang mga inverse visual.

Bukod pa rito, pinapayagan ng VectorFusion ang isang multi-stage na configuration na mas epektibo at may mas mataas na kalidad. Ang pamamaraang ito ay nagsisimula sa pagkuha ng mga sample ng raster mula sa modelo ng pagsasabog ng text-to-image tinatawag Stable Diffusion. Ang mga sample ay awtomatikong sinusubaybayan ng VectorFusion gamit ang LIVE. Ang mga sample na ito, gayunpaman, ay madalas na kulang sa detalye, nakakainip, o mahirap ibagay sa vector graphics. Pagpapahusay ng sigla at pagkakapare-pareho ng teksto sa pamamagitan ng Score Distillation Sampling.

Ang VectorFusion ay maaaring gumawa ng pixel art sa istilo ng mga lumang video game sa pamamagitan ng paglilimita sa mga SVG path sa mga parisukat sa isang grid.

Ang diskarte na ito ay madaling pinalawak upang suportahan ang pagbuo ng text-to-sketch. Upang matuto ng abstract line drawing na tumpak na kumakatawan sa text na ibinigay ng user, gumuhit muna kami ng 16 na random na piniling stroke. Pagkatapos, ino-optimize namin ang aming nakatagong Score Distillation Sampling loss.

Basahin ang mga kaugnay na artikulo:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Dumating na ang Araw ng Pagsentensiya: Ang Kapalaran ni CZ ay Nagbabalanse habang Isinasaalang-alang ng Korte ng US ang Panawagan ng DOJ

Si Changpeng Zhao ay handang harapin ang sentensiya sa korte ng US sa Seattle ngayon.

Malaman Higit Pa

Ang Mga Tagapagtatag ng Samourai Wallet ay Inakusahan na Nagpapadali ng $2B sa Darknet Deals

Ang pangamba ng mga tagapagtatag ng Samourai Wallet ay kumakatawan sa isang kapansin-pansing pag-urong para sa industriya, na binibigyang-diin ang patuloy na ...

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Ang Pantera Capital ay Namumuhunan Sa TON Blockchain, Nagpahayag ng Kumpiyansa Sa Potensyal ng Telegram na Palawakin ang Accessibility ng Crypto
Negosyo Ulat sa Balita Teknolohiya
Ang Pantera Capital ay Namumuhunan Sa TON Blockchain, Nagpahayag ng Kumpiyansa Sa Potensyal ng Telegram na Palawakin ang Accessibility ng Crypto
Mayo 2, 2024
Ang Mitosis ay Nagtaas ng $7M Sa Pagpopondo Mula sa Amber Group At Foresight Ventures Upang Isulong ang Modular Liquidity Protocol Nito
Negosyo Ulat sa Balita Teknolohiya
Ang Mitosis ay Nagtaas ng $7M Sa Pagpopondo Mula sa Amber Group At Foresight Ventures Upang Isulong ang Modular Liquidity Protocol Nito
Mayo 2, 2024
Nakipagtulungan ang Galxe Sa Jambo Para Palawakin ang Global Accessibility To Web3
Negosyo Ulat sa Balita Teknolohiya
Nakipagtulungan ang Galxe Sa Jambo Para Palawakin ang Global Accessibility To Web3
Mayo 2, 2024
Nakahanda ang Med-Gemini ng Google na Magsimula sa GPT-4 Sa Superior na Pagganap nito sa Pangangalagang Pangkalusugan
AI Wiki Balita software Teknolohiya
Nakahanda ang Med-Gemini ng Google na Magsimula sa GPT-4 Sa Superior na Pagganap nito sa Pangangalagang Pangkalusugan
Mayo 2, 2024
CRYPTOMERIA LABS PTE. LTD.