Informe de notícies Tecnologia
Juny 19, 2023

SnapFusion: model ràpid de text a imatge per a dispositius mòbils en 1.9 segons

En breu

SnapFusion canvia la creació de contingut executant-se models de difusió text a imatge directament en dispositius mòbils, reduint costos i abordant els problemes de privadesa.

SnapFusion és un model d'IA de text a imatge que permet als usuaris generar imatges impressionants a partir de descripcions en llenguatge natural, tot en només dos segons als seus dispositius mòbils. Enrere han quedat els dies de confiar en GPU de gamma alta o serveis basats en núvol per executar aquests models complexos. SnapFusion democratitza la creació de contingut posant el poder de la difusió de text a imatge en mans dels usuaris.

SnapFusion: model ràpid i eficient de text a imatge per a dispositius mòbils en 1.9 segons
Crèdit: Midjourney / lili10292#2100

Crear imatges realistes a partir de descripcions de text sempre ha estat una tasca difícil. Models anteriors requereixen grans arquitectures de xarxa i múltiples iteracions de reducció de soroll, fent-les computacionalment costós i lent. A més, l'execució d'aquests models sovint implicava enviar dades d'usuari a serveis de tercers, augmentant preocupacions de privadesa.

Per abordar aquests reptes, els creadors de SnapFusion van desenvolupar una arquitectura de xarxa eficient i van millorar el procés de destil·lació gradual. En identificar les redundàncies en el model original, van introduir una UNet eficient i van reduir el càlcul del descodificador d'imatges mitjançant destil·lació de dades. A més, van millorar la destil·lació de pas mitjançant l'exploració d'estratègies d'entrenament i la introducció de tècniques de regularització.

arxiv.org/pdf/2306.00980.pdf

Experiments extensos sobre el Conjunt de dades MS-COCO va demostrar la superioritat de SnapFusion. Amb només vuit passos de reducció de soroll, SnapFusion va aconseguir millors puntuacions FID i CLIP en comparació amb l'anterior model d'última generació, Stable Diffusion v1.5, que requeria 50 passos. Aquesta notable millora en eficiència i rendiment obre noves possibilitats per a la creació de continguts.

L'impacte de SnapFusion va més enllà dels seus èxits tècnics. Corrent models de difusió text a imatge directament als dispositius mòbils, elimina la necessitat de GPU cares i serveis basats en núvol. Això no només redueix els costos, sinó que també aborda els problemes de privadesa associats amb l'enviament de dades d'usuari a tercers. Els usuaris ara poden alliberar la seva creativitat i generar imatges d'alta qualitat sobre la marxa.

La mida del paràmetre del model es pot reduir encara més per fer-lo compatible amb diversos dispositius de vora. A més, optimitzar el model per a diferents dispositius mòbils aconseguir una inferència ràpida velocitats és un tema de recerca en curs.

És essencial utilitzar SnapFusion i tecnologies similars de manera responsable per evitar aplicacions malicioses. Es poden prendre mesures, com ara sistemes de detecció automàtica que identifiquen i senyalitzen contingut d'imatge que infringeixi la normativa. En aconseguir un equilibri entre la innovació i les consideracions ètiques, SnapFusion pot canviar la creació de contingut alhora que garanteix una experiència d'usuari segura i responsable.

Llegeix més sobre AI:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

més articles
Damir Yalalov
Damir Yalalov

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

L'apetit institucional creix cap als ETF de Bitcoin enmig de la volatilitat

Les divulgacions a través de les presentacions 13F revelen inversors institucionals notables que s'estan incursionant en els ETF de Bitcoin, subratllant una acceptació creixent de...

saber Més

Arriba el dia de la sentència: el destí de CZ està en equilibri mentre el tribunal nord-americà considera la petició del DOJ

Changpeng Zhao està a punt d'enfrontar-se avui a la sentència en un tribunal dels Estats Units a Seattle.

saber Més
Uneix-te a la nostra comunitat tecnològica innovadora
Més...
Llegeix més
LD Capital, Antalpha Ventures i Highblock Limited s'uneixen per llançar un fons de liquiditat ETF de Hong Kong de 128 milions de dòlars
Negocis mercats Informe de notícies
LD Capital, Antalpha Ventures i Highblock Limited s'uneixen per llançar un fons de liquiditat ETF de Hong Kong de 128 milions de dòlars
Pot 8, 2024
Inside Wall Street Memes (WSM): Presentació dels titulars
Negocis mercats Històries i ressenyes Tecnologia
Inside Wall Street Memes (WSM): Presentació dels titulars
Pot 7, 2024
Descobriu Crypto Whales: qui és qui al mercat
Negocis mercats Històries i ressenyes Tecnologia
Descobriu Crypto Whales: qui és qui al mercat
Pot 7, 2024
Orbiter Finance s'associa amb la xarxa Zulu de Bitcoin Layer 2 i es desplega a Is Lwazi Testnet
Negocis Informe de notícies Tecnologia
Orbiter Finance s'associa amb la xarxa Zulu de Bitcoin Layer 2 i es desplega a Is Lwazi Testnet 
Pot 7, 2024
CRYPTOMERIA LABS PTE. LTD.