Ziņojums Tehnoloģija
Jūnijs 19, 2023

SnapFusion: ātrs teksta pārveides modelis mobilajām ierīcēm 1.9 sekunžu laikā

Īsumā

SnapFusion maina satura izveidi, palaižot teksta-attēlu difūzijas modeļi tieši mobilajās ierīcēs, samazinot izmaksas un risinot privātuma problēmas.

SnapFusion ir teksta pārveidošanas AI modelis, kas lietotājiem ļauj ģenerēt satriecošus attēlus no aprakstiem dabiskā valodā, un tas viss notiek tikai divu sekunžu laikā savās mobilajās ierīcēs. Ir pagājuši laiki, kad šo sarežģīto modeļu darbināšanai paļāvās uz augstākās klases GPU vai mākoņpakalpojumiem. SnapFusion demokratizē satura izveidi, nododot teksta-attēlu izplatīšanas iespējas lietotāju rokās.

SnapFusion: ātrs un efektīvs teksta pārveides modelis mobilajām ierīcēm 1.9 sekunžu laikā
Kredīts: Midjourney / lili10292#2100

Reālistisku attēlu izveide no teksta aprakstiem vienmēr ir bijis sarežģīts uzdevums. Iepriekšējie modeļi nepieciešama liela tīkla arhitektūra un vairākas trokšņa slāpēšanas iterācijas, padarot tās skaitļošanas ziņā dārgi un lēni. Turklāt šo modeļu darbināšana bieži ietvēra lietotāju datu nosūtīšanu uz trešo pušu pakalpojumiem, paaugstināšanu bažas par privātumu.

Lai risinātu šīs problēmas, SnapFusion veidotāji izstrādāja efektīvu tīkla arhitektūru un uzlaboja pakāpeniskās destilācijas procesu. Identificējot dublēšanos sākotnējā modelī, viņi ieviesa efektīvu UNet un samazināja attēla dekodētāja aprēķinus, izmantojot datu destilācija. Turklāt viņi uzlaboja pakāpju destilāciju, izpētot apmācības stratēģijas un ieviešot legalizācijas metodes.

arxiv.org/pdf/2306.00980.pdf

Plaši eksperimenti par MS-COCO datu kopa demonstrēja SnapFusion pārākumu. Tikai ar astoņiem trokšņa samazināšanas soļiem SnapFusion sasniedza labākus FID un CLIP rādītājus salīdzinājumā ar iepriekšējo. vismodernākais modelis, Stable Diffusion v1.5, kas prasīja 50 darbības. Šis ievērojamais efektivitātes un veiktspējas uzlabojums paver jaunas iespējas satura veidošanai.

SnapFusion ietekme pārsniedz tā tehniskos sasniegumus. Skrienot teksta-attēlu difūzijas modeļi tieši mobilajās ierīcēs, tas novērš nepieciešamību pēc dārgiem GPU un mākoņpakalpojumiem. Tas ne tikai samazina izmaksas, bet arī novērš privātuma problēmas, kas saistītas ar lietotāja datu nosūtīšanu trešajām pusēm. Lietotāji tagad var atraisīt savu radošumu un ģenerēt augstas kvalitātes attēlus, atrodoties ceļā.

Modeļa parametru izmēru var vēl vairāk samazināt, lai tas būtu savietojams ar dažādām malu ierīcēm. Turklāt modeļa optimizēšana dažādām mobilajām ierīcēm izdarīt ātrus secinājumus ātrumi ir nepārtraukta izpētes tēma.

Lai novērstu ļaunprātīgas lietojumprogrammas, SnapFusion un līdzīgas tehnoloģijas ir jāizmanto atbildīgi. Var veikt pasākumus, piemēram, automātiskās noteikšanas sistēmas, kas identificē un atzīmē attēlu saturu, kas pārkāpj noteikumus. Panākot līdzsvaru starp inovācijām un ētiskiem apsvērumiem, SnapFusion var mainīt satura izveidi, vienlaikus nodrošinot drošu un atbildīgu lietotāja pieredzi.

Lasiet vairāk par AI:

Atbildības noraidīšana

Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.

Par Autors

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Vairāk rakstus
Damirs Jalalovs
Damirs Jalalovs

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Hot Stories

Inside Wall Street Memes (WSM): Virsrakstu atklāšana

by Viktorija Palčika
07. gada 2024. maijs

Atklājiet kriptovaļus: kurš ir kurš tirgū

by Viktorija Palčika
07. gada 2024. maijs
Pievienojieties mūsu informatīvajam izdevumam.
Jaunākās ziņas

Nepastāvības apstākļos institucionālā apetīte pieaug pret Bitcoin ETF

Informācijas atklāšana, izmantojot 13F pieteikumus, atklāj ievērojamus institucionālos investorus, kas iesaistās Bitcoin ETF, uzsverot pieaugošo pieņemšanu ...

Uzziniet vairāk

Pienāk notiesāšanas diena: CZ liktenis ir līdzsvarā, jo ASV tiesa izskata DOJ lūgumu

Šodien ASV tiesā Sietlā Čanpens Džao ir gatavs notiesāt.

Uzziniet vairāk
Pievienojieties mūsu novatoriskajai tehnoloģiju kopienai
Lasīt vairāk
Vairāk
LD Capital, Antalpha Ventures un Highblock Limited apvieno spēkus, lai izveidotu Honkongas ETF likviditātes fondu 128 miljonu dolāru vērtībā
bizness Markets Ziņojums
LD Capital, Antalpha Ventures un Highblock Limited apvieno spēkus, lai izveidotu Honkongas ETF likviditātes fondu 128 miljonu dolāru vērtībā
8. gada 2024. maijs
Inside Wall Street Memes (WSM): Virsrakstu atklāšana
bizness Markets Stāsti un atsauksmes Tehnoloģija
Inside Wall Street Memes (WSM): Virsrakstu atklāšana
7. gada 2024. maijs
Atklājiet kriptovaļus: kurš ir kurš tirgū
bizness Markets Stāsti un atsauksmes Tehnoloģija
Atklājiet kriptovaļus: kurš ir kurš tirgū
7. gada 2024. maijs
Orbiter finanšu partneri ar Bitcoin Layer 2 Zulu tīklu un tiek izvietoti vietnē Lwazi Testnet
bizness Ziņojums Tehnoloģija
Orbiter finanšu partneri ar Bitcoin Layer 2 Zulu tīklu un tiek izvietoti vietnē Lwazi Testnet 
7. gada 2024. maijs
CRYPTOMERIA LABS PTE. LTD.