Novinky Technika
Listopadu 23, 2022

Převod textu do SVG: Společnost Berkeley oznámila abstrahující difúzní model založený na pixelech

Stručně

Syntéza textu na obrázek – výzkumníci z UC Berkeley demonstrují vektorovou grafiku s úpravou textu difúzní modely

V syntéze textu na obrázek mají modely difúze prokázána vynikající výsledky. Difúzní modely se učí vytvářet rastrové obrázky extrémně různorodých objektů a situací pomocí obrovských databází anotovaných obrázků. Pro digitální ikony, grafiku a nálepky však návrháři obvykle používají vektorové reprezentace obrázků, jako je Scalable Vector Graphics (SVG). Vektorová grafika je malá a může být zmenšena na libovolnou velikost.

Převod textu do SVG: Společnost Berkeley oznámila abstrahující difúzní model založený na pixelech

UC Berkeley demonstruje, jak vytvořit vektorovou grafiku, kterou lze exportovat jako SVG pomocí textově podmíněného difúzního modelu, který byl trénován na obrazových pixelových reprezentacích. Dosahuje toho bez použití rozsáhlých sbírek SVG s titulky. Místo toho vědci z Berkeley vektorizují a šíření textu do obrázku vzorku a dolaďte jej ztrátou Score Distillation Sampling, motivovanou nedávnou prací na syntéze textu do 3D.

Příklad generovaných vektorů

Podívejte se na čerstvě vygenerovanou SVG galerii zde.

Vektorová grafika je malá, ale zachová si ostrost, když ji změníte na libovolnou velikost. Výzkumníci z Berkeley vylepšují ztrátu obrazu a textu na základě Score Destillation Sampling pro optimalizaci vektorové grafiky. DiffVG diferencovatelný SVG renderer, který používá VectorFusion, umožňuje inverzní vizualizace.

VectorFusion navíc umožňuje vícestupňovou konfiguraci, která je efektivnější a kvalitnější. Tato metoda začíná odebráním rastrových vzorků z model šíření textu do obrázku volal Stable Diffusion. Vzorky jsou poté automaticky sledovány pomocí VectorFusion pomocí LIVE. Tyto vzorky však často postrádají detaily, jsou nudné nebo se obtížně přizpůsobují vektorové grafice. Posílení živosti a konzistence textu prostřednictvím Score Destillation Sampling.

VectorFusion dokáže vytvářet pixel art ve stylu starých videoher omezením cest SVG na čtverce na mřížce.

Tento přístup lze snadno rozšířit o podporu generování textu na skicu. Abychom se naučili abstraktní perokresbu, která přesně reprezentuje text dodaný uživatelem, nejprve nakreslíme 16 náhodně vybraných tahů. Poté optimalizujeme naši ztrátu latentního skóre destilací.

Přečtěte si související články:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více

Zakladatelé peněženky Samourai byli obviněni z usnadňování 2 miliard dolarů v obchodech Darknet

Obavy zakladatelů Peněženky Samourai představují pro průmysl významnou překážku, která podtrhuje přetrvávající ...

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Pantera Capital investuje do blockchainu TON, vyjadřuje důvěru v potenciál Telegramu rozšířit dostupnost kryptoměn
Business Novinky Technika
Pantera Capital investuje do blockchainu TON, vyjadřuje důvěru v potenciál Telegramu rozšířit dostupnost kryptoměn
2
Mitosis získává finanční prostředky ve výši 7 milionů USD od Amber Group a Foresight Ventures, aby podpořila svůj modulární protokol likvidity
Business Novinky Technika
Mitosis získává finanční prostředky ve výši 7 milionů USD od Amber Group a Foresight Ventures, aby podpořila svůj modulární protokol likvidity
2
Galxe spolupracuje se společností Jambo, aby rozšířila globální dostupnost Web3
Business Novinky Technika
Galxe spolupracuje se společností Jambo, aby rozšířila globální dostupnost Web3
2
Med-Gemini od Googlu se chystá dát náskok GPT-4 S vynikajícím výkonem ve zdravotnictví
AI Wiki Novinky Vývoj Technika
Med-Gemini od Googlu se chystá dát náskok GPT-4 S vynikajícím výkonem ve zdravotnictví
2
CRYPTOMERIA LABS PTE. LTD.