Novinky Technika
Června 19, 2023

SnapFusion: Rychlý model převodu textu na obrázek pro mobilní zařízení během 1.9 sekundy

Stručně

SnapFusion mění vytváření obsahu spuštěním modely šíření textu do obrázku přímo na mobilních zařízeních, což snižuje náklady a řeší problémy s ochranou soukromí.

SnapFusion je model umělé inteligence typu text-to-image, který uživatelům umožňuje vytvářet úžasné obrázky z popisů v přirozeném jazyce, a to vše během pouhých dvou sekund na jejich mobilních zařízeních. Pryč jsou dny, kdy se při provozu těchto složitých modelů spoléhaly na špičková GPU nebo cloudové služby. SnapFusion demokratizuje tvorbu obsahu tím, že dává sílu šíření textu do obrázku do rukou uživatelů.

SnapFusion: Rychlý a efektivní model převodu textu na obrázek pro mobilní zařízení během 1.9 sekundy
Credit: Midjourney / lili10292#2100

Vytváření realistických obrázků z textových popisů bylo vždy náročným úkolem. Předchozí modely vyžaduje velké síťové architektury a vícenásobné odšumovací iterace, které je vytvářejí výpočetně drahé a pomalé. Kromě toho provozování těchto modelů často zahrnovalo odesílání uživatelských dat do služeb třetích stran, zvyšování soukromí.

K řešení těchto problémů vyvinuli tvůrci SnapFusion účinnou síťovou architekturu a zlepšili proces krokové destilace. Identifikací redundancí v původním modelu zavedli efektivní UNet a snížili výpočet obrazového dekodéru prostřednictvím datová destilace. Navíc vylepšili krokovou destilaci zkoumáním tréninkových strategií a zavedením regularizačních technik.

arxiv.org/pdf/2306.00980.pdf

Rozsáhlé experimenty na Datový soubor MS-COCO demonstroval převahu SnapFusion. S pouhými osmi kroky odšumování dosáhl SnapFusion lepších skóre FID a CLIP ve srovnání s předchozím nejmodernější model, Stable Diffusion v1.5, která vyžadovala 50 kroků. Toto pozoruhodné zlepšení efektivity a výkonu otevírá nové možnosti pro tvorbu obsahu.

Dopad SnapFusion přesahuje jeho technické úspěchy. Běháním modely šíření textu do obrázku přímo na mobilních zařízeních, eliminuje potřebu drahých GPU a cloudových služeb. To nejen snižuje náklady, ale také řeší obavy o soukromí spojené s odesíláním uživatelských dat třetím stranám. Uživatelé nyní mohou popustit uzdu své kreativitě a vytvářet vysoce kvalitní snímky na cestách.

Velikost parametrů modelu lze dále zmenšit, aby byl kompatibilní s různými okrajovými zařízeními. Navíc optimalizace modelu pro různá mobilní zařízení dosáhnout rychlého závěru rychlost je aktuálním tématem výzkumu.

Je nezbytné používat SnapFusion a podobné technologie zodpovědně, abyste zabránili škodlivým aplikacím. Lze přijmout opatření, jako jsou automatické detekční systémy, které identifikují a označí obsah obrázku, který porušuje předpisy. Díky dosažení rovnováhy mezi inovacemi a etickými ohledy může SnapFusion změnit tvorbu obsahu a zároveň zajistit bezpečný a odpovědný uživatelský zážitek.

Přečtěte si více o AI:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
LD Capital, Antalpha Ventures a Highblock Limited spojily své síly a spustily likvidní fond Hong Kong ETF v hodnotě 128 milionů USD
Business Trhy Novinky
LD Capital, Antalpha Ventures a Highblock Limited spojily své síly a spustily likvidní fond Hong Kong ETF v hodnotě 128 milionů USD
8
Uvnitř Wall Street Memes (WSM): Odhalení titulků
Business Trhy Příběhy a recenze Technika
Uvnitř Wall Street Memes (WSM): Odhalení titulků
7
Objevte Crypto Whales: Kdo je kdo na trhu
Business Trhy Příběhy a recenze Technika
Objevte Crypto Whales: Kdo je kdo na trhu
7
Orbiter Finance spolupracuje se sítí Bitcoin Layer 2 Zulu a nasazuje na Is Lwazi Testnet
Business Novinky Technika
Orbiter Finance spolupracuje se sítí Bitcoin Layer 2 Zulu a nasazuje na Is Lwazi Testnet 
7
CRYPTOMERIA LABS PTE. LTD.