Vijesti Tehnologija
Lipnja 19, 2023

SnapFusion: brzi model pretvaranja teksta u sliku za mobilne uređaje unutar 1.9 sekundi

Ukratko

SnapFusion mijenja stvaranje sadržaja pokretanjem modeli difuzije teksta u sliku izravno na mobilnim uređajima, smanjujući troškove i rješavajući pitanja privatnosti.

SnapFusion je model umjetne inteligencije pretvaranja teksta u sliku koji korisnicima omogućuje generiranje zadivljujućih slika iz opisa prirodnog jezika, sve u samo dvije sekunde na njihovim mobilnim uređajima. Prošli su dani oslanjanja na vrhunske GPU-ove ili usluge temeljene na oblaku za pokretanje ovih složenih modela. SnapFusion demokratizira stvaranje sadržaja stavljajući snagu difuzije teksta u sliku u ruke korisnika.

SnapFusion: brz i učinkovit model pretvaranja teksta u sliku za mobilne uređaje unutar 1.9 sekundi
kredit: Midjourney / lili10292#2100

Stvaranje realističnih slika iz tekstualnih opisa uvijek je bio izazovan zadatak. Prethodni modeli zahtijeva velike mrežne arhitekture i više ponavljanja uklanjanja buke, čineći ih računski skupo i sporo. Nadalje, pokretanje ovih modela često je uključivalo slanje korisničkih podataka uslugama trećih strana, povećavajući zabrinutost zbog privatnosti.

Kako bi odgovorili na te izazove, tvorci SnapFusiona razvili su učinkovitu mrežnu arhitekturu i poboljšali proces postupne destilacije. Identificirajući redundancije u izvornom modelu, uveli su učinkovit UNet i smanjili izračune dekodera slike kroz destilacija podataka. Dodatno, poboljšali su postupnu destilaciju istraživanjem strategija obuke i uvođenjem tehnika regulacije.

arxiv.org/pdf/2306.00980.pdf

Opsežni eksperimenti na Skup podataka MS-COCO pokazao je superiornost SnapFusiona. Sa samo osam koraka za uklanjanje šuma, SnapFusion je postigao bolje FID i CLIP rezultate u usporedbi s prethodnim najsuvremeniji model, Stable Diffusion v1.5, koji je zahtijevao 50 koraka. Ovo izvanredno poboljšanje učinkovitosti i performansi otvara nove mogućnosti za stvaranje sadržaja.

Utjecaj SnapFusiona nadilazi njegova tehnička dostignuća. Trčanjem modeli difuzije teksta u sliku izravno na mobilnim uređajima, eliminira potrebu za skupim GPU-ovima i uslugama temeljenim na oblaku. Ovo ne samo da smanjuje troškove, već također rješava pitanja privatnosti povezana sa slanjem korisničkih podataka trećim stranama. Korisnici sada mogu osloboditi svoju kreativnost i generirati visokokvalitetne slike u pokretu.

Veličina parametara modela može se dodatno smanjiti kako bi bio kompatibilan s raznim rubnim uređajima. Osim toga, optimizacija modela za različite mobilne uređaje postići brzo zaključivanje brzine su stalna tema istraživanja.

Neophodno je koristiti SnapFusion i slične tehnologije odgovorno kako biste spriječili zlonamjerne aplikacije. Mogu se poduzeti mjere, poput sustava za automatsko otkrivanje koji identificiraju i označavaju slikovni sadržaj koji krši propise. Uspostavljanjem ravnoteže između inovacija i etičkih razmatranja, SnapFusion može promijeniti stvaranje sadržaja dok istovremeno osigurava sigurno i odgovorno korisničko iskustvo.

Pročitajte više o AI:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Više članaka
Damir Yalalov
Damir Yalalov

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Institucionalni apetit raste prema Bitcoin ETF-ovima usred volatilnosti

Objave putem 13F prijava otkrivaju značajne institucionalne ulagače koji se upuštaju u Bitcoin ETF-ove, naglašavajući sve veće prihvaćanje ...

Znati više

Stiže dan izricanja presude: CZ-ova sudbina visi na ravnoteži dok američki sud razmatra izjavu DOJ-a

Changpeng Zhao danas će se suočiti s kaznom na američkom sudu u Seattleu.

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
LD Capital, Antalpha Ventures i Highblock Limited udružuju snage kako bi pokrenuli fond likvidnosti Hong Kong ETF-a od 128 milijuna dolara
posao tržišta Vijesti
LD Capital, Antalpha Ventures i Highblock Limited udružuju snage kako bi pokrenuli fond likvidnosti Hong Kong ETF-a od 128 milijuna dolara
Neka 8, 2024
Inside Wall Street Memes (WSM): otkrivanje naslova
posao tržišta Priče i recenzije Tehnologija
Inside Wall Street Memes (WSM): otkrivanje naslova
Neka 7, 2024
Otkrijte Crypto Whales: Tko je tko na tržištu
posao tržišta Priče i recenzije Tehnologija
Otkrijte Crypto Whales: Tko je tko na tržištu
Neka 7, 2024
Orbiter Finance surađuje s Bitcoin Layer 2 Zulu mrežom i postavlja se na Is Lwazi Testnet
posao Vijesti Tehnologija
Orbiter Finance surađuje s Bitcoin Layer 2 Zulu mrežom i postavlja se na Is Lwazi Testnet 
Neka 7, 2024
CRYPTOMERIA LABS PTE. LTD.