Uutisraportti Elektroniikka
Kesäkuu 19, 2023

SnapFusion: Nopea tekstistä kuvaksi -malli mobiililaitteille 1.9 sekunnissa

Lyhyesti

SnapFusion muuttaa sisällön luomista suorittamalla tekstistä kuvaksi diffuusiomallit suoraan mobiililaitteilla, mikä vähentää kustannuksia ja ratkaisee tietosuojaongelmia.

SnapFusion on tekstistä kuvaksi tekoälymalli, jonka avulla käyttäjät voivat luoda upeita kuvia luonnollisen kielen kuvauksista vain kahdessa sekunnissa mobiililaitteillaan. Takana ovat ajat, jolloin näiden monimutkaisten mallien ohjauksessa luotettiin huippuluokan GPU:ihin tai pilvipohjaisiin palveluihin. SnapFusion demokratisoi sisällön luomisen antamalla tekstistä kuvaksi -hajauttamisen käyttäjien käsiin.

SnapFusion: Nopea ja tehokas tekstistä kuvaksi -malli mobiililaitteille 1.9 sekunnissa
Pistetilanne: Midjourney / lili10292#2100

Realististen kuvien luominen tekstikuvauksista on aina ollut haastava tehtävä. Aiemmat mallit vaativat suuret verkkoarkkitehtuurit ja useita vaimentavia iteraatioita, jotka tekevät niistä laskennallisesti kallis ja hidas. Lisäksi näiden mallien käyttäminen sisälsi usein käyttäjätietojen lähettämisen kolmannen osapuolen palveluihin, nostamista yksityisyydensuoja.

Vastatakseen näihin haasteisiin SnapFusionin luojat kehittivät tehokkaan verkkoarkkitehtuurin ja paransivat vaiheittaista tislausprosessia. Tunnistamalla redundanssit alkuperäisessä mallissa he ottivat käyttöön tehokkaan UNetin ja vähensivät kuvadekooderin laskentaa tietojen tislaus. Lisäksi he tehostivat vaihetislaamista tutkimalla koulutusstrategioita ja ottamalla käyttöön laillistamistekniikoita.

arxiv.org/pdf/2306.00980.pdf

Laajat kokeilut MS-COCO-tietojoukko osoitti SnapFusionin paremmuuden. Vain kahdeksalla vaimennusvaiheella SnapFusion saavutti paremmat FID- ja CLIP-pisteet edelliseen verrattuna huippuluokan malli, Stable Diffusion v1.5, joka vaati 50 vaihetta. Tämä huomattava tehokkuuden ja suorituskyvyn parannus avaa uusia mahdollisuuksia sisällön luomiseen.

SnapFusionin vaikutus ylittää sen tekniset saavutukset. Juoksemalla tekstistä kuvaksi diffuusiomallit suoraan mobiililaitteilla, se eliminoi kalliiden grafiikkasuorittimien ja pilvipohjaisten palveluiden tarpeen. Tämä ei ainoastaan ​​vähennä kustannuksia, vaan myös ratkaisee tietosuojaongelmat, jotka liittyvät käyttäjätietojen lähettämiseen kolmansille osapuolille. Käyttäjät voivat nyt päästää luovuutensa valloilleen ja luoda korkealaatuisia kuvia liikkeellä ollessaan.

Mallin parametrikokoa voidaan edelleen pienentää, jotta se on yhteensopiva erilaisten reunalaitteiden kanssa. Lisäksi mallin optimointi eri mobiililaitteille tehdä nopea johtopäätös nopeudet on jatkuva tutkimusaihe.

SnapFusionia ja vastaavia teknologioita on käytettävä vastuullisesti haittaohjelmien estämiseksi. Voidaan toteuttaa toimenpiteitä, kuten automaattisia tunnistusjärjestelmiä, jotka tunnistavat ja merkitsevät säännöksiä rikkovan kuvasisällön. Löytämällä tasapainon innovaatioiden ja eettisten näkökohtien välillä SnapFusion voi muuttaa sisällöntuotantoa ja varmistaa samalla turvallisen ja vastuullisen käyttökokemuksen.

Lue lisää tekoälystä:

Vastuun kieltäminen

Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.

Author

Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa. 

lisää artikkeleita
Damir Yalalov
Damir Yalalov

Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa. 

Institutionaalinen ruokahalu kasvaa kohti Bitcoin ETF:iä volatiliteetin keskellä

13F-hakemusten kautta tehdyt ilmoitukset paljastavat merkittäviä institutionaalisia sijoittajia, jotka harrastavat Bitcoinin ETF:itä, mikä korostaa kasvavaa hyväksyntää ...

Tiedä enemmän

Tuomiopäivä saapuu: CZ:n kohtalo on tasapainossa, kun Yhdysvaltain tuomioistuin harkitsee DOJ:n vetoomusta

Changpeng Zhao odottaa tänään tuomiota Yhdysvaltain oikeudessa Seattlessa.

Tiedä enemmän
Liity innovatiiviseen teknologiayhteisöömme
Lue lisää
Lue lisää
LD Capital, Antalpha Ventures ja Highblock Limited yhdistävät voimansa perustaakseen 128 miljoonan dollarin Hongkongin ETF-likviditeettirahaston
Bisnes markkinat Uutisraportti
LD Capital, Antalpha Ventures ja Highblock Limited yhdistävät voimansa perustaakseen 128 miljoonan dollarin Hongkongin ETF-likviditeettirahaston
Voi 8, 2024
Inside Wall Street Memes (WSM): Otsikoiden paljastaminen
Bisnes markkinat Tarinoita ja arvosteluja Elektroniikka
Inside Wall Street Memes (WSM): Otsikoiden paljastaminen
Voi 7, 2024
Tutustu Crypto Whales: Kuka on kuka markkinoilla
Bisnes markkinat Tarinoita ja arvosteluja Elektroniikka
Tutustu Crypto Whales: Kuka on kuka markkinoilla
Voi 7, 2024
Orbiter Finance tekee yhteistyötä Bitcoin Layer 2 Zulu -verkon kanssa ja ottaa käyttöön Lwazi Testnetissä
Bisnes Uutisraportti Elektroniikka
Orbiter Finance tekee yhteistyötä Bitcoin Layer 2 Zulu -verkon kanssa ja ottaa käyttöön Lwazi Testnetissä 
Voi 7, 2024
CRYPTOMERIA LABS PTE. OY.