Tudósítást Technológia
November 23, 2022

Szöveg SVG-be: Berkeley bejelentette absztraháló pixel alapú diffúziós modellt

Röviden

Szöveg-kép szintézis – Az UC Berkeley kutatói vektorgrafikát mutatnak be szövegfeltételekkel diffúziós modellek

A szöveg-kép szintézisben a diffúziós modellek rendelkeznek igazolták kiemelkedő eredményeket. A diffúziós modellek megtanulnak raszteres képeket készíteni rendkívül változatos objektumokról és helyzetekről a megjegyzésekkel ellátott képek hatalmas adatbázisa segítségével. A digitális ikonok, grafikák és matricák esetében azonban a tervezők általában vektoros ábrázolásokat alkalmaznak, például a Scalable Vector Graphics-ot (SVG-ket). A vektorgrafika kicsi, és bármilyen méretre méretezhető.

Szöveg SVG-be: Berkeley bejelentette absztraháló pixel alapú diffúziós modellt

Az UC Berkeley bemutatja, hogyan lehet vektorgrafikát készíteni, amely SVG-ként exportálható egy szövegfeltételes diffúziós modell segítségével, amelyet képpixel-ábrázolásokra tanítottak. Ezt anélkül éri el, hogy kiterjedt SVG-gyűjteményt használna feliratokkal. Ehelyett a Berkeley kutatói vektorizálják a szöveg-kép diffúzió mintavétel és finomhangolás Score Distillation Sampling veszteséggel, amelyet a szöveg-3D szintézissel kapcsolatos közelmúltbeli munka motivált.

Példa generált vektorokra

Tekintse meg a frissen generált SVG galériát itt.

A vektorgrafika kicsi, de bármilyen méretre méretezve megőrzi élességét. A Berkeley kutatói a Score Distillation Sampling alapján javítják a kép-szöveg veszteséget a vektorgrafika optimalizálása érdekében. A VectorFusion által használt DiffVG differenciálható SVG renderer inverz vizualizációt tesz lehetővé.

Ezenkívül a VectorFusion többlépcsős konfigurációt tesz lehetővé, amely hatékonyabb és jobb minőségű. Ez a módszer azzal kezdődik, hogy rasztermintákat veszünk a szöveg-kép diffúziós modell hívott Stable Diffusion. A mintákat ezután a VectorFusion a LIVE segítségével automatikusan nyomon követi. Ezek a minták azonban gyakran hiányosak a részletekért, unalmasak vagy nehezen adaptálhatók a vektorgrafikához. Az élénkség és a szöveg konzisztenciája a Score Destillation Sampling segítségével.

A VectorFusion a régi videojátékok stílusában képes pixelművészetet készíteni azáltal, hogy az SVG-útvonalakat a rácson lévő négyzetekre korlátozza.

Ez a megközelítés könnyen bővíthető a szövegből vázlattá generálás támogatására. Annak érdekében, hogy megtanuljunk egy absztrakt vonalrajzot, amely pontosan reprezentálja a felhasználó által megadott szöveget, először 16 véletlenszerűen kiválasztott vonást rajzolunk. Ezután optimalizáljuk látens Score Desztillációs mintavételi veszteségünket.

Olvassa el a kapcsolódó cikkeket:

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

További cikkek
Damir Jalalov
Damir Jalalov

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

Hot Stories
Csatlakozzon hírlevelünkhöz.
Legfrissebb hírek

Elérkezett az ítélethirdetés napja: CZ sorsa egyensúlyban van, mivel az Egyesült Államok bírósága mérlegeli a DOJ kérelmét

Changpeng Zhao ítéletet vár ma egy seattle-i amerikai bíróságon.

Tudjon meg többet

A Samourai Wallet alapítóit azzal vádolják, hogy 2 milliárd dollárt segítettek a Darknet ügyletekben

A Samourai Wallet alapítóinak aggodalma jelentős visszalépést jelent az iparág számára, aláhúzva a kitartó ...

Tudjon meg többet
Csatlakozzon innovatív technológiai közösségünkhöz
KATT ide
Tovább
A Pantera Capital befektet a TON blokkláncba, bizalmát fejezi ki a Telegram kripto-hozzáférhetőségének kiszélesítése iránt
üzleti Tudósítást Technológia
A Pantera Capital befektet a TON blokkláncba, bizalmát fejezi ki a Telegram kripto-hozzáférhetőségének kiszélesítése iránt
May 2, 2024
A Mitosis 7 millió dollár finanszírozást gyűjt az Amber Group és a Foresight Ventures moduláris likviditási protokollja fejlesztése érdekében
üzleti Tudósítást Technológia
A Mitosis 7 millió dollár finanszírozást gyűjt az Amber Group és a Foresight Ventures moduláris likviditási protokollja fejlesztése érdekében
May 2, 2024
A Galxe együttműködik a Jambóval a globális hozzáférhetőség kiterjesztése érdekében Web3
üzleti Tudósítást Technológia
A Galxe együttműködik a Jambóval a globális hozzáférhetőség kiterjesztése érdekében Web3
May 2, 2024
A Google Med-Gemini készen áll az előnyre GPT-4 Az egészségügyben nyújtott kiemelkedő teljesítményével
AI Wiki Hírek szoftver Technológia
A Google Med-Gemini készen áll az előnyre GPT-4 Az egészségügyben nyújtott kiemelkedő teljesítményével
May 2, 2024
CRYPTOMERIA LABS PTE. KFT.