Haber Raporu Teknoloji
24 Kasım 2022

Stability AI'S Stable Diffusion 2 Algoritma Sonunda Herkese Açık: yeni deep2img modeli, süper çözünürlüklü yükseltici, yetişkinlere uygun içerik yok

Kısaca

Stable Diffusion 2.0 modeli öncekinden daha hızlı, açık kaynak, ölçeklenebilir, daha sağlam

Stable Diffusion gerçek zamanlı işleme için yeni özelliklerle GPU'ya hazır hale gelir

Derinlik yönlendirmeli stable diffusion model – Yaratıcı uygulamalar için yeni fikirlerle görüntüden görüntüye

Stability AI vardır serbest hakkında blogunda yeni bir makale Stable Diffusion 2. İçinde, Stability AI öncekinden daha verimli ve sağlam olan yeni bir algoritma önerirken diğer son teknoloji yöntemlerle karşılaştırır.

Açık AI'lar Stable Diffusion 2 Algoritma Sonunda Herkese Açık: yeni deep2img modeli, süper çözünürlüklü yükseltici, yetişkinlere uygun içerik yok

CompVis'in orijinali Stable Diffusion V1 modeli devrim açık kaynağın doğası AI modelleri ve dünya çapında yüzlerce farklı model ve gelişme üretti. Github'daki diğer programlardan daha hızlı, iki aydan kısa bir sürede 10,000'e ulaşan 33,000 Github yıldızına en hızlı tırmanışlardan birini gördü.

Özgün Stable Diffusion V1 sürümü, Robin Rombach'ın dinamik ekibi tarafından yönetildi (Stability AI) ve Prof. Dr. Björn Ommer liderliğindeki LMU Münih'teki CompVis Group'tan Patrick Esser (Runway ML). Latent ile laboratuvarın önceki çalışmasını temel aldılar Difüzyon Modelleri ve LAION ve Eleuther AI'dan kritik destek aldı.

Açık AI'lar Stable Diffusion 2 Algoritma Sonunda Herkese Açık: yeni deep2img modeli, süper çözünürlüklü yükseltici, yetişkinlere uygun içerik yok
Açık AI'lar Stable Diffusion 2 Algoritma Sonunda Herkese Açık: yeni deep2img modeli, süper çözünürlüklü yükseltici, yetişkinlere uygun içerik yok

Ne yapar Stable Diffusion v1 farklı Stable Diffusion v2? 

Stable Diffusion 2.0, önceki sürüme göre bir dizi önemli geliştirme ve özellik içerir, bu yüzden onlara bir göz atalım.

The Stable Diffusion 2.0 sürümü, LAION tarafından geliştirilen yepyeni bir metin kodlayıcı (OpenCLIP) ile eğitilmiş sağlam metinden görüntüye modeller içerir. Stability AIkalitesini önemli ölçüde artıran, oluşturulan görüntüler önceki V1 sürümleri üzerinde. Bu sürümün metinden görüntüye modelleri, 512×512 piksel ve 768×768 piksel varsayılan çözünürlüklerde görüntüler çıkarabilir.

Bu modeller, LAION-5B veri kümesinin estetik bir alt kümesi kullanılarak eğitilir. Stability AIDeepFloyd ekibi, daha sonra LAION'un NSFW filtresini kullanarak yetişkinlere uygun içeriği hariç tutmak için filtrelenir.

50 DDIM örnek adımı, 50 sınıflandırıcı içermeyen rehber ölçek ve 1.5, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0 ve 8.0 kullanılarak yapılan değerlendirmeler, kontrol noktalarında göreli iyileştirmeler olduğunu gösterir:

Ne yapar Stable Diffusion v1 farklı Stable Diffusion v2?

Stable Diffusion 2.0 artık görüntü çözünürlüğünü dört kat artıran bir Yükseltici Difüzyon modelini içeriyor. Modelimizin bir örneği yükseltme düşük kalitede oluşturulan bir görüntünün (128×128) daha yüksek çözünürlüklü bir görüntüye (512×512) dönüştürülmesi aşağıda gösterilmiştir. Stable Diffusion 2.0, metinden görüntüye modellerimizle birleştirildiğinde artık 2048×2048 veya daha yüksek çözünürlüklü görüntüler üretebilir.

Yeni derinlik kılavuzlu stable diffusion model, deep2img, V1'deki önceki görüntüden görüntüye özelliğini tamamen yeni yaratıcı olanaklarla genişletir. Depth2img, bir girdi görüntüsünün derinliğini belirler (mevcut bir modeli kullanarak) ve ardından yeni görüntüleri hem metin hem de derinlik bilgisine dayalıdır. Görüntüye Derinlik, görüntünün tutarlılığını ve derinliğini korurken orijinalinden önemli ölçüde farklı görünen değişiklikler sunarak çok sayıda yeni yaratıcı uygulama sağlayabilir.

yenilikler Stable Diffusion 2?

  • Yeni stable diffusion model 768×768 çözünürlük sunar.
  • U-Net, sürüm 1.5 ile aynı miktarda parametreye sahiptir, ancak sıfırdan eğitilmiştir ve metin kodlayıcı olarak OpenCLIP-ViT/H kullanır. Sözde bir v-tahmin modeli SD 2.0-v'dir.
  • Yukarıda belirtilen model, yine kullanıma sunulan ve 2.0×512 görüntülerde tipik bir gürültü tahmin modeli olarak eğitilen SD 512 tabanından ayarlanmıştır.
  • x4 ölçekleme ile gizli bir metin kılavuzlu difüzyon modeli eklendi.
  • Rafine SD 2.0 tabanlı derinlik kılavuzlu stable diffusion model. Model, yapıyı koruyan img2img ve şekil koşullu sentez için kullanılabilir ve MiDaS tarafından elde edilen monoküler derinlik tahminlerine göre koşullandırılır.
  • SD 2.0 temeline dayalı geliştirilmiş metin kılavuzlu iç boyama modeli.

Geliştiriciler, tıpkı ilk yinelemede olduğu gibi çok çalıştı. Stable Diffusion, modeli tek bir GPU'da çalışacak şekilde optimize etmek için - en başından mümkün olduğunca çok kişi tarafından erişilebilir olmasını istediler. Milyonlarca kişi bu modelleri ele geçirdiğinde ve kesinlikle olağanüstü şeyler inşa etmek için işbirliği yaptığında neler olduğunu zaten gördüler. Bu, açık kaynağın gücüdür: son teknoloji bir modeli eğitecek kaynaklara sahip olmayan ancak bir modelle inanılmaz şeyler yapma becerisine sahip milyonlarca yetenekli insanın muazzam potansiyelinden yararlanmak.

yenilikler Stable Diffusion 2?

Deep2img gibi güçlü yeni özellikler ve daha iyi çözünürlük yükseltme yetenekleriyle birleştirilen bu yeni güncelleme, çok sayıda yeni uygulamanın temelini oluşturacak ve yeni yaratıcı potansiyelin patlamasını sağlayacaktır.

Hakkında daha fazla bilgi Stable Diffusion:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Daha fazla haber
Damir Yalalov
Damir Yalalov

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Hot Stories
Bültenimize Katılın.
En Yeni Haberler

Volatilite Ortasında Bitcoin ETF'lerine Yönelik Kurumsal İştah Artıyor

13F başvuruları aracılığıyla yapılan açıklamalar, önemli kurumsal yatırımcıların Bitcoin ETF'leriyle uğraştığını ortaya koyuyor ve Bitcoin ETF'lerinin artan bir şekilde kabul edildiğinin altını çiziyor.

bilmek Daha

Hüküm Günü Geliyor: ABD Mahkemesi Adalet Bakanlığı'nın Savunmasını Değerlendirirken CZ'nin Kaderi Dengede

Changpeng Zhao bugün Seattle'daki bir ABD mahkemesinde cezayla karşı karşıya kalmaya hazırlanıyor.

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
Injective, inEVM'ye Yeniden Bağlantı Güvenliği Getirmek İçin AltLayer ile Güçlerini Birleştiriyor
İşletme Haber Raporu Teknoloji
Injective, inEVM'ye Yeniden Bağlantı Güvenliği Getirmek İçin AltLayer ile Güçlerini Birleştiriyor
Mayıs 3, 2024
Masa, MASA Borç Verme Havuzunu Tanıtmak İçin Teller ile İşbirliği Yapıyor, Temelde USDC Borçlanmasını Sağlıyor
Piyasalar Haber Raporu Teknoloji
Masa, MASA Borç Verme Havuzunu Tanıtmak İçin Teller ile İşbirliği Yapıyor, Temelde USDC Borçlanmasını Sağlıyor
Mayıs 3, 2024
Velodrome Önümüzdeki Haftalarda Superchain Beta Sürümünü Piyasaya Sürüyor ve OP Yığın Katmanı 2 Blok Zincirlerine Genişliyor
Piyasalar Haber Raporu Teknoloji
Velodrome Önümüzdeki Haftalarda Superchain Beta Sürümünü Piyasaya Sürüyor ve OP Yığın Katmanı 2 Blok Zincirlerine Genişliyor
Mayıs 3, 2024
CARV, Veri Katmanını Merkezi Olmayan Hale Getirmek ve Ödülleri Dağıtmak İçin Aethir ile Ortaklığını Duyurdu
İşletme Haber Raporu Teknoloji
CARV, Veri Katmanını Merkezi Olmayan Hale Getirmek ve Ödülleri Dağıtmak İçin Aethir ile Ortaklığını Duyurdu
Mayıs 3, 2024
CRYPTOMERIA LABS PTE. LTD.