Xəbər Hesabatı Texnologiya
İyun 19, 2023

SnapFusion: Mobil Cihazlar üçün 1.9 Saniyədə Sürətli Mətndən Şəkilə Model

Qısaca

SnapFusion işləməklə məzmunun yaradılmasını dəyişir mətndən şəkilə diffuziya modelləri birbaşa mobil cihazlarda, xərclərin azaldılması və məxfilik problemlərinin həlli.

SnapFusion istifadəçilərə mobil cihazlarında cəmi iki saniyə ərzində təbii dil təsvirlərindən heyrətamiz şəkillər yaratmağa imkan verən mətndən-şəklə AI modelidir. Bu mürəkkəb modelləri idarə etmək üçün yüksək səviyyəli GPU-lara və ya bulud əsaslı xidmətlərə güvənmək günləri geridə qaldı. SnapFusion mətndən təsvirə yayılması gücünü istifadəçilərin əlinə verməklə məzmun yaradılmasını demokratikləşdirir.

SnapFusion: 1.9 saniyə ərzində mobil cihazlar üçün sürətli və effektiv mətndən-şəklə model
Kredit: Midjourney / lili10292#2100

Mətn təsvirlərindən real təsvirlər yaratmaq həmişə çətin iş olub. Əvvəlki modellər böyük şəbəkə arxitekturası tələb olunur və çoxsaylı denoising iterations, onları edilməsi hesablama baxımından bahalı və yavaş. Bundan əlavə, bu modelləri işə salmaq tez-tez istifadəçi məlumatlarının üçüncü tərəf xidmətlərinə göndərilməsini və artırılmasını əhatə edirdi gizlilik narahatlıqları.

Bu problemləri həll etmək üçün SnapFusion yaradıcıları səmərəli şəbəkə arxitekturasını inkişaf etdirdilər və mərhələli distillə prosesini təkmilləşdirdilər. Orijinal modeldə artıqlıqları müəyyən edərək, onlar səmərəli UNet təqdim etdilər və təsvirin dekoderinin hesablanmasını azaltdılar. məlumat distilləsi. Bundan əlavə, onlar təlim strategiyalarını araşdıraraq və nizamlama üsullarını tətbiq etməklə addım distilləsini gücləndirdilər.

arxiv.org/pdf/2306.00980.pdf

üzərində geniş təcrübələr MS-COCO verilənlər toplusu SnapFusion-un üstünlüyünü nümayiş etdirdi. Yalnız səkkiz denoising addımı ilə SnapFusion əvvəlki ilə müqayisədə daha yaxşı FID və CLIP balları əldə etdi. ən müasir model, Stable Diffusion 1.5 addım tələb edən v50. Səmərəlilik və performansda bu nəzərəçarpacaq təkmilləşmə məzmunun yaradılması üçün yeni imkanlar açır.

SnapFusion-un təsiri texniki nailiyyətlərindən kənara çıxır. Qaçışla mətndən şəkilə diffuziya modelləri birbaşa mobil cihazlarda, o, bahalı GPU-lara və bulud əsaslı xidmətlərə ehtiyacı aradan qaldırır. Bu, təkcə xərcləri azaldır, həm də istifadəçi məlumatlarının üçüncü tərəflərə göndərilməsi ilə bağlı məxfilik problemlərini həll edir. İstifadəçilər indi öz yaradıcılıqlarını üzə çıxara və yolda yüksək keyfiyyətli şəkillər yarada bilərlər.

Modelin parametr ölçüsü onu müxtəlif kənar cihazlarla uyğunlaşdırmaq üçün daha da kiçildilə bilər. Bundan əlavə, müxtəlif mobil cihazlar üçün modeli optimallaşdırmaq sürətli nəticə çıxarmaq sürətlər davamlı tədqiqat mövzusudur.

Zərərli proqramların qarşısını almaq üçün SnapFusion və oxşar texnologiyalardan məsuliyyətlə istifadə etmək vacibdir. Qaydaları pozan görüntü məzmununu müəyyən edən və qeyd edən avtomatik aşkarlama sistemləri kimi tədbirlər görülə bilər. SnapFusion innovasiya və etik mülahizələr arasında tarazlıq yaratmaqla təhlükəsiz və məsuliyyətli istifadəçi təcrübəsini təmin etməklə yanaşı, məzmun yaradılmasını dəyişə bilər.

AI haqqında daha çox oxuyun:

Məsuliyyətdən imtina

uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.

Müəllif haqqında

Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi. 

Ətraflı məqalələr
Damir Yalalov
Damir Yalalov

Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi. 

İnstitusional iştah dəyişkənlik fonunda Bitcoin ETF-lərə doğru artır

13F sənədləri vasitəsilə edilən açıqlamalar, Bitcoin ETF-ləri ilə məşğul olan görkəmli institusional investorları ortaya qoyur və bu, artan qəbulu vurğulayır ...

Daha çox məlumat

Hökm günü gəldi: ABŞ Məhkəməsi DOJ-nin iddiasını nəzərdən keçirərkən CZ-nin taleyi tarazlıqda qalır

Changpeng Zhao bu gün Sietldəki ABŞ məhkəməsində hökm oxumağa hazırlaşır.

Daha çox məlumat
İnnovativ Texniki İcmamıza Qoşulun
Daha çox oxu
Daha çox oxu
LD Capital, Antalpha Ventures və Highblock Limited 128 milyon dollarlıq Honq Konq ETF Likvidlik Fondunu işə salmaq üçün qüvvələri birləşdirir
Biznes Markets Xəbər Hesabatı
LD Capital, Antalpha Ventures və Highblock Limited 128 milyon dollarlıq Honq Konq ETF Likvidlik Fondunu işə salmaq üçün qüvvələri birləşdirir
8 May 2024
Inside Wall Street Memes (WSM): Başlıqların açılması
Biznes Markets Hekayələr və Rəylər Texnologiya
Inside Wall Street Memes (WSM): Başlıqların açılması
7 May 2024
Kriptobalinaları kəşf edin: Bazarda Kim Kimdir
Biznes Markets Hekayələr və Rəylər Texnologiya
Kriptobalinaları kəşf edin: Bazarda Kim Kimdir
7 May 2024
Orbiter Finance Bitcoin Layer 2 Zulu Şəbəkəsi ilə Tərəfdaşdır və Is Lwazi Testnet-də yerləşdirilir
Biznes Xəbər Hesabatı Texnologiya
Orbiter Finance Bitcoin Layer 2 Zulu Şəbəkəsi ilə Tərəfdaşdır və Is Lwazi Testnet-də yerləşdirilir 
7 May 2024
CRYPTOMERIA LABS PTE. LTD.