Uudiste reportaaž Tehnoloogia
Juuni 19, 2023

SnapFusion: kiire tekstist pildiks muutmise mudel mobiilseadmetele 1.9 sekundiga

Põgusalt

SnapFusion muudab sisu loomist käivitades tekstist pildiks difusioonimudelid otse mobiilseadmetes, vähendades kulusid ja lahendades privaatsusprobleeme.

SnapFusion on tekstist pildiks muutev tehisintellekti mudel, mis võimaldab kasutajatel luua loomuliku keele kirjelduste põhjal vapustavaid pilte ja seda kõike oma mobiilseadmetes vaid kahe sekundiga. Möödas on ajad, mil nende keeruliste mudelite käitamiseks kasutati tipptasemel GPU-sid või pilvepõhiseid teenuseid. SnapFusion demokratiseerib sisu loomise, andes tekstist pildiks levitamise võimsuse kasutajate kätesse.

SnapFusion: kiire ja tõhus tekstist pildiks muutmise mudel mobiilseadmetele 1.9 sekundiga
krediit: Midjourney / lili10292#2100

Tekstikirjeldustest realistlike piltide loomine on alati olnud väljakutseid esitav ülesanne. Varasemad mudelid vaja suuri võrguarhitektuure ja mitu müra vähendamise iteratsiooni, muutes need arvutuslikult kallis ja aeglane. Lisaks hõlmas nende mudelite käitamine sageli kasutajate andmete saatmist kolmandate osapoolte teenustele ja kogumist privaatsuse probleemid.

Nende väljakutsetega toimetulemiseks töötasid SnapFusioni loojad välja tõhusa võrguarhitektuuri ja täiustasid astmelist destilleerimisprotsessi. Tuvastades algses mudelis liiasused, võtsid nad kasutusele tõhusa UNeti ja vähendasid kujutise dekoodri arvutusi. andmete destilleerimine. Lisaks täiustasid nad astmelist destilleerimist, uurides koolitusstrateegiaid ja juurutades reguleerimistehnikaid.

arxiv.org/pdf/2306.00980.pdf

Ulatuslikud katsed MS-COCO andmestik demonstreeris SnapFusioni paremust. Vaid kaheksa müra summutamise sammuga saavutas SnapFusion eelmisega võrreldes paremad FID- ja CLIP-skoorid tipptasemel mudel, Stable Diffusion v1.5, mis nõudis 50 sammu. See tõhususe ja jõudluse märkimisväärne paranemine avab uusi võimalusi sisu loomiseks.

SnapFusioni mõju ulatub kaugemale selle tehnilistest saavutustest. Jooksmisega tekstist pildiks difusioonimudelid otse mobiilseadmetes, kaotab see vajaduse kallite GPU-de ja pilvepõhiste teenuste järele. See mitte ainult ei vähenda kulusid, vaid lahendab ka privaatsusprobleeme, mis on seotud kasutajaandmete kolmandatele osapooltele saatmisega. Kasutajad saavad nüüd liikvel olles oma loovuse valla päästa ja kvaliteetseid pilte luua.

Mudeli parameetrite suurust saab veelgi vähendada, et see ühilduks erinevate servaseadmetega. Lisaks mudeli optimeerimine erinevate mobiilseadmete jaoks teha kiireid järeldusi kiirus on pidev uurimisteema.

Pahatahtlike rakenduste vältimiseks on oluline kasutada SnapFusioni ja sarnaseid tehnoloogiaid vastutustundlikult. Võib võtta meetmeid, näiteks automaatseid tuvastamissüsteeme, mis tuvastavad ja märgistavad eeskirju rikkuva pildisisu. Luues tasakaalu innovatsiooni ja eetiliste kaalutluste vahel, saab SnapFusion muuta sisuloomet, tagades samas turvalise ja vastutustundliku kasutuskogemuse.

Loe AI kohta lähemalt:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Veel artikleid
Damir Jalalov
Damir Jalalov

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Institutsionaalne isu kasvab volatiilsuse tõttu Bitcoini ETF-ide poole

13F-i dokumentide kaudu avaldatud teave paljastab märkimisväärsed institutsionaalsed investorid, kes tegelevad Bitcoini ETF-idega, rõhutades, et ...

Rohkem teada

Karistuspäev saabub: CZ saatus on tasakaalus, kuna USA kohus võtab DOJ palvet arvesse

Changpeng Zhao ootab täna ees kohtuotsus USA Seattle'i kohtus.

Rohkem teada
Liituge meie uuendusliku tehnikakogukonnaga
Loe rohkem
Loe edasi
LD Capital, Antalpha Ventures ja Highblock Limited ühendavad jõud 128 miljoni dollari suuruse Hongkongi ETFi likviidsusfondi käivitamiseks
Äri turud Uudiste reportaaž
LD Capital, Antalpha Ventures ja Highblock Limited ühendavad jõud 128 miljoni dollari suuruse Hongkongi ETFi likviidsusfondi käivitamiseks
Võib 8 2024
Wall Streeti meemide sees (WSM): pealkirjade avalikustamine
Äri turud Lood ja ülevaated Tehnoloogia
Wall Streeti meemide sees (WSM): pealkirjade avalikustamine
Võib 7 2024
Avastage krüptovaalad: kes on kes turul
Äri turud Lood ja ülevaated Tehnoloogia
Avastage krüptovaalad: kes on kes turul
Võib 7 2024
Orbiter Finance partnerid Bitcoin Layer 2 Zulu võrguga ja juurutavad on Lwazi Testnet
Äri Uudiste reportaaž Tehnoloogia
Orbiter Finance partnerid Bitcoin Layer 2 Zulu võrguga ja juurutavad on Lwazi Testnet 
Võib 7 2024
CRYPTOMERIA LABS PTE. LTD.