Novice Tehnologija
Junij 19, 2023

SnapFusion: hiter model besedila v sliko za mobilne naprave v 1.9 sekunde

Na kratko

SnapFusion spremeni ustvarjanje vsebine z zagonom modeli difuzije besedila v sliko neposredno na mobilnih napravah, kar zmanjšuje stroške in obravnava pomisleke glede zasebnosti.

SnapFusion je model umetne inteligence besedila v sliko, ki uporabnikom omogoča ustvarjanje osupljivih slik iz opisov v naravnem jeziku, vse v samo dveh sekundah na njihovih mobilnih napravah. Minili so dnevi, ko smo se za izvajanje teh zapletenih modelov zanašali na vrhunske grafične procesorje ali storitve v oblaku. SnapFusion demokratizira ustvarjanje vsebine tako, da daje moč razširjanja besedila v sliko v roke uporabnikom.

SnapFusion: hiter in učinkovit model besedila v sliko za mobilne naprave v 1.9 sekunde
Zasluge: Midjourney / lili10292#2100

Ustvarjanje realističnih slik iz besedilnih opisov je bilo vedno zahtevna naloga. Prejšnji modeli zahteva velike omrežne arhitekture in več iteracij za odpravljanje šumov, zaradi česar so računsko drago in počasno. Poleg tega je izvajanje teh modelov pogosto vključevalo pošiljanje uporabniških podatkov storitvam tretjih oseb, kar je povečalo skrbi za zasebnost.

Za reševanje teh izzivov so ustvarjalci SnapFusion razvili učinkovito omrežno arhitekturo in izboljšali postopek postopne destilacije. Z identifikacijo presežkov v izvirnem modelu so uvedli učinkovit UNet in zmanjšali izračun slikovnega dekodirnika prek destilacija podatkov. Poleg tega so izboljšali postopno destilacijo z raziskovanjem strategij usposabljanja in uvedbo tehnik regulacije.

arxiv.org/pdf/2306.00980.pdf

Obsežni poskusi na Nabor podatkov MS-COCO dokazal superiornost SnapFusion. S samo osmimi koraki za odpravljanje hrupa je SnapFusion dosegel boljše rezultate FID in CLIP v primerjavi s prejšnjim najsodobnejši model, Stable Diffusion v1.5, ki je zahteval 50 korakov. To izjemno izboljšanje učinkovitosti in zmogljivosti odpira nove možnosti za ustvarjanje vsebine.

Vpliv SnapFusion presega njegove tehnične dosežke. S tekom modeli difuzije besedila v sliko neposredno na mobilnih napravah, odpravlja potrebo po dragih grafičnih procesorjih in storitvah v oblaku. To ne le zmanjša stroške, ampak tudi obravnava pomisleke glede zasebnosti, povezane s pošiljanjem uporabniških podatkov tretjim osebam. Uporabniki lahko zdaj sprostijo svojo ustvarjalnost in ustvarijo visokokakovostne slike na poti.

Velikost parametrov modela je mogoče dodatno zmanjšati, da je združljiv z različnimi robnimi napravami. Poleg tega optimizacijo modela za različne mobilne naprave doseči hitro sklepanje hitrosti je stalna raziskovalna tema.

Bistveno je, da SnapFusion in podobne tehnologije uporabljate odgovorno, da preprečite zlonamerne aplikacije. Sprejeti je mogoče ukrepe, kot so samodejni sistemi za zaznavanje, ki prepoznajo in označijo slikovno vsebino, ki krši predpise. Z doseganjem ravnovesja med inovativnostjo in etičnimi vidiki lahko SnapFusion spremeni ustvarjanje vsebine, hkrati pa zagotavlja varno in odgovorno uporabniško izkušnjo.

Preberite več o AI:

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

več člankov
Damir Yalalov
Damir Yalalov

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

Hot Stories

Inside Wall Street Memes (WSM): razkritje naslovnic

by Viktorija Palčik
Maj 07, 2024

Odkrijte Crypto Whales: kdo je kdo na trgu

by Viktorija Palčik
Maj 07, 2024
Pridružite se našemu glasilu.
Zadnje novice

Institucionalni apetit raste proti Bitcoin ETF-jem sredi volatilnosti

Razkritja prek vlog 13F razkrivajo pomembne institucionalne vlagatelje, ki se ukvarjajo z Bitcoin ETF, kar poudarja vse večje sprejemanje ...

Več o tem

Prihaja dan obsodbe: usoda CZ visi na ravnovesju, ko ameriško sodišče obravnava tožbeni razlog DOJ

Changpeng Zhao se danes sooča z obsodbo na ameriškem sodišču v Seattlu.

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
LD Capital, Antalpha Ventures in Highblock Limited združijo moči za ustanovitev 128 milijonov USD likvidnostnega sklada Hong Kong ETF
ŽELITE POSTATI PARTNER Prisotnost Novice
LD Capital, Antalpha Ventures in Highblock Limited združijo moči za ustanovitev 128 milijonov USD likvidnostnega sklada Hong Kong ETF
Maj 8, 2024
Inside Wall Street Memes (WSM): razkritje naslovnic
ŽELITE POSTATI PARTNER Prisotnost Zgodbe in ocene Tehnologija
Inside Wall Street Memes (WSM): razkritje naslovnic
Maj 7, 2024
Odkrijte Crypto Whales: kdo je kdo na trgu
ŽELITE POSTATI PARTNER Prisotnost Zgodbe in ocene Tehnologija
Odkrijte Crypto Whales: kdo je kdo na trgu
Maj 7, 2024
Orbiter Finance sodeluje z omrežjem Zulu Bitcoin Layer 2 in se uvaja na Is Lwazi Testnet
ŽELITE POSTATI PARTNER Novice Tehnologija
Orbiter Finance sodeluje z omrežjem Zulu Bitcoin Layer 2 in se uvaja na Is Lwazi Testnet 
Maj 7, 2024
CRYPTOMERIA LABS PTE. LTD.