Haber Raporu Teknoloji
Haziran 19, 2023

SnapFusion: Mobil Cihazlar için 1.9 Saniyede Hızlı Metinden Görüntüye Modelleme

Kısaca

SnapFusion, içerik oluşturmayı çalıştırarak değiştirir metinden görüntüye difüzyon modelleri doğrudan mobil cihazlarda, maliyetleri düşürür ve gizlilikle ilgili endişeleri giderir.

SnapFusion kullanıcıların mobil cihazlarında yalnızca iki saniye içinde doğal dil açıklamalarından çarpıcı görüntüler oluşturmasını sağlayan bir metinden görüntüye yapay zeka modelidir. Bu karmaşık modelleri çalıştırmak için üst düzey GPU'lara veya bulut tabanlı hizmetlere güvenme günleri geride kaldı. SnapFusion, metinden görüntüye difüzyonun gücünü kullanıcılara vererek içerik oluşturmayı demokratikleştirir.

SnapFusion: Mobil Cihazlar için 1.9 Saniyede Hızlı ve Verimli Metinden Görüntüye Modelleme
kredi: Midjourney / lili10292#2100

Metin açıklamalarından gerçekçi görüntüler oluşturmak her zaman zorlu bir görev olmuştur. Önceki modeller gerekli büyük ağ mimarileri ve çoklu gürültü giderici yinelemeler, onları hesaplama açısından pahalı ve yavaş. Ayrıca, bu modellerin çalıştırılması genellikle kullanıcı verilerinin üçüncü taraf hizmetlere gönderilmesini içeriyordu. Gizlilik endişeleri.

Bu zorlukların üstesinden gelmek için SnapFusion'un yaratıcıları, verimli bir ağ mimarisi geliştirdi ve kademeli damıtma sürecini geliştirdi. Orijinal modeldeki fazlalıkları belirleyerek verimli bir UNet tanıttılar ve görüntü kod çözücünün hesaplamasını veri damıtma. Ek olarak, eğitim stratejilerini keşfederek ve düzenlileştirme tekniklerini tanıtarak kademeli damıtmayı geliştirdiler.

arxiv.org/pdf/2306.00980.pdf

üzerinde kapsamlı deneyler MS-COCO veri kümesi SnapFusion'un üstünlüğünü gösterdi. SnapFusion yalnızca sekiz gürültü giderme adımıyla öncekine kıyasla daha iyi FID ve CLIP puanları elde etti son teknoloji modeli, Stable Diffusion 1.5 adım gerektiren v50. Verimlilik ve performanstaki bu dikkate değer gelişme, içerik oluşturma için yeni olanaklar sunuyor.

SnapFusion'ın etkisi, teknik başarılarının ötesine geçer. Koşarak metinden görüntüye difüzyon modelleri doğrudan mobil cihazlarda, pahalı GPU'lara ve bulut tabanlı hizmetlere olan ihtiyacı ortadan kaldırır. Bu, yalnızca maliyetleri azaltmakla kalmaz, aynı zamanda kullanıcı verilerinin üçüncü taraflara gönderilmesiyle ilgili gizlilik endişelerini de giderir. Kullanıcılar artık hareket halindeyken yaratıcılıklarını ortaya çıkarabilir ve yüksek kaliteli görüntüler oluşturabilir.

Modelin parametre boyutu, çeşitli uç cihazlarla uyumlu hale getirmek için daha da azaltılabilir. Ek olarak, modeli farklı mobil cihazlar için optimize etmek hızlı çıkarım elde etmek hızlar devam eden bir araştırma konusudur.

Kötü amaçlı uygulamaları önlemek için SnapFusion ve benzeri teknolojileri sorumlu bir şekilde kullanmak esastır. Yönetmelikleri ihlal eden görüntü içeriğini belirleyen ve işaretleyen otomatik algılama sistemleri gibi önlemler alınabilir. Yenilikçilik ve etik hususlar arasında bir denge kuran SnapFusion, güvenli ve sorumlu bir kullanıcı deneyimi sağlarken içerik oluşturma sürecini değiştirebilir.

AI hakkında daha fazlasını okuyun:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Daha fazla haber
Damir Yalalov
Damir Yalalov

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Volatilite Ortasında Bitcoin ETF'lerine Yönelik Kurumsal İştah Artıyor

13F başvuruları aracılığıyla yapılan açıklamalar, önemli kurumsal yatırımcıların Bitcoin ETF'leriyle uğraştığını ortaya koyuyor ve Bitcoin ETF'lerinin artan bir şekilde kabul edildiğinin altını çiziyor.

bilmek Daha

Hüküm Günü Geliyor: ABD Mahkemesi Adalet Bakanlığı'nın Savunmasını Değerlendirirken CZ'nin Kaderi Dengede

Changpeng Zhao bugün Seattle'daki bir ABD mahkemesinde cezayla karşı karşıya kalmaya hazırlanıyor.

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
LD Capital, Antalpha Ventures ve Highblock Limited, 128 Milyon Dolarlık Hong Kong ETF Likidite Fonu Başlatmak İçin Güçlerini Birleştiriyor
İşletme Piyasalar Haber Raporu
LD Capital, Antalpha Ventures ve Highblock Limited, 128 Milyon Dolarlık Hong Kong ETF Likidite Fonu Başlatmak İçin Güçlerini Birleştiriyor
Mayıs 8, 2024
Inside Wall Street Memes (WSM): Manşetlerin Açıklanması
İşletme Piyasalar Hikayeler ve İncelemeler Teknoloji
Inside Wall Street Memes (WSM): Manşetlerin Açıklanması
Mayıs 7, 2024
Kripto Balinalarını Keşfedin: Piyasada Kim Kimdir?
İşletme Piyasalar Hikayeler ve İncelemeler Teknoloji
Kripto Balinalarını Keşfedin: Piyasada Kim Kimdir?
Mayıs 7, 2024
Orbiter Finance, Bitcoin Layer 2 Zulu Ağıyla Ortak Oluyor ve Is Lwazi Testnet'te Konuşlanıyor
İşletme Haber Raporu Teknoloji
Orbiter Finance, Bitcoin Layer 2 Zulu Ağıyla Ortak Oluyor ve Is Lwazi Testnet'te Konuşlanıyor 
Mayıs 7, 2024
CRYPTOMERIA LABS PTE. LTD.