Buletin de stiri Tehnologia
19 Iunie, 2023

SnapFusion: model rapid text-to-image pentru dispozitive mobile în 1.9 secunde

Pe scurt

SnapFusion modifică crearea de conținut prin rulare modele de difuzie text la imagine direct pe dispozitivele mobile, reducând costurile și abordând problemele legate de confidențialitate.

SnapFusion este un model AI text-to-image care permite utilizatorilor să genereze imagini uimitoare din descrieri în limbaj natural, toate în doar două secunde pe dispozitivele lor mobile. Au dispărut vremurile în care se baza pe GPU-uri de ultimă generație sau pe servicii bazate pe cloud pentru a rula aceste modele complexe. SnapFusion democratizează crearea de conținut punând puterea difuzării text-to-image în mâinile utilizatorilor.

SnapFusion: model rapid și eficient de text în imagine pentru dispozitive mobile în 1.9 secunde
Credit: Midjourney / lili10292#2100

Crearea de imagini realiste din descrierile de text a fost întotdeauna o sarcină provocatoare. Modelele anterioare necesită arhitecturi mari de rețea și mai multe iterații de eliminare a zgomotului, făcându-le costisitoare și lente din punct de vedere computațional. Mai mult, rularea acestor modele presupunea adesea trimiterea datelor utilizatorilor către servicii terțe, ridicând protecția vieții private.

Pentru a aborda aceste provocări, creatorii SnapFusion au dezvoltat o arhitectură de rețea eficientă și au îmbunătățit procesul de distilare în etape. Prin identificarea redundanțelor în modelul original, au introdus un UNet eficient și au redus calculul decodorului de imagine prin distilarea datelor. În plus, au îmbunătățit distilarea pasă prin explorarea strategiilor de antrenament și prin introducerea tehnicilor de regularizare.

arxiv.org/pdf/2306.00980.pdf

Experimente ample pe Setul de date MS-COCO a demonstrat superioritatea SnapFusion. Cu doar opt pași de eliminare a zgomotului, SnapFusion a obținut scoruri FID și CLIP mai bune în comparație cu precedentul model de ultimă generație, Stable Diffusion v1.5, care a necesitat 50 de pași. Această îmbunătățire remarcabilă a eficienței și performanței deschide noi posibilități pentru crearea de conținut.

Impactul SnapFusion depășește realizările sale tehnice. Prin alergare modele de difuzie text la imagine direct pe dispozitivele mobile, elimină nevoia de GPU-uri costisitoare și servicii bazate pe cloud. Acest lucru nu numai că reduce costurile, dar abordează și preocupările legate de confidențialitate asociate cu trimiterea datelor utilizatorilor către terți. Utilizatorii își pot dezlănțui acum creativitatea și pot genera imagini de înaltă calitate din mers.

Dimensiunea parametrilor modelului poate fi redusă și mai mult pentru a-l face compatibil cu diferite dispozitive de margine. În plus, optimizarea modelului pentru diferite dispozitive mobile obține o inferență rapidă vitezele este un subiect de cercetare în curs de desfășurare.

Este esențial să utilizați SnapFusion și tehnologii similare în mod responsabil pentru a preveni aplicațiile rău intenționate. Se pot lua măsuri, cum ar fi sistemele de detectare automată care identifică și semnalează conținutul imaginilor care încalcă reglementările. Găsind un echilibru între inovație și considerente etice, SnapFusion poate schimba crearea de conținut, asigurând în același timp o experiență de utilizator sigură și responsabilă.

Citiți mai multe despre AI:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Mai multe articole
Damir Yalalov
Damir Yalalov

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Hot Stories
Alăturați-vă Newsletter-ului nostru.
Ultimele ştiri

Apetitul instituțional crește față de ETF-urile Bitcoin pe fondul volatilității

Dezvăluirile prin dosarele 13F dezvăluie investitori instituționali de seamă care se amestecă în ETF-uri Bitcoin, subliniind o acceptare tot mai mare a...

Aflați mai multe

Sosește ziua sentinței: soarta lui CZ este în echilibru, în timp ce tribunalul american ia în considerare pledoaria DOJ

Changpeng Zhao este pe cale de a fi condamnat astăzi într-un tribunal american din Seattle.

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Stacks, Moonriver Network, Hedera și Iron Fish vor participa la programul de amplificator interchain al Axelar
Buletin de stiri Tehnologia
Stacks, Moonriver Network, Hedera și Iron Fish vor participa la programul de amplificator interchain al Axelar
7 Mai, 2024
Tesla îmbrățișează Dogecoin: spor major pentru moneda Meme, deoarece devine o opțiune de plată pe magazinul online Tesla
pieţe Povești și recenzii Tehnologia
Tesla îmbrățișează Dogecoin: spor major pentru moneda Meme, deoarece devine o opțiune de plată pe magazinul online Tesla
7 Mai, 2024
Morph își prezintă rețeaua Holesky Testnet cu integrare optimistă zkEVM, mecanism de punte și caracteristici de rețea de secvențiere descentralizate
Buletin de stiri Tehnologia
Morph își prezintă rețeaua Holesky Testnet cu integrare optimistă zkEVM, mecanism de punte și caracteristici de rețea de secvențiere descentralizate
6 Mai, 2024
Robinhood Crypto primește o notificare Wells de la Securities and Exchange Commission cu privire la presupuse încălcări ale valorilor mobiliare
pieţe Buletin de stiri Tehnologia
Robinhood Crypto primește o notificare Wells de la Securities and Exchange Commission cu privire la presupuse încălcări ale valorilor mobiliare
6 Mai, 2024
CRYPTOMERIA LABS PTE. LTD.