Stability AI'S Stable Diffusion 2 Algoritma Sonunda Herkese Açık: yeni deep2img modeli, süper çözünürlüklü yükseltici, yetişkinlere uygun içerik yok
Kısaca
Stable Diffusion 2.0 modeli öncekinden daha hızlı, açık kaynak, ölçeklenebilir, daha sağlam
Stable Diffusion gerçek zamanlı işleme için yeni özelliklerle GPU'ya hazır hale gelir
Derinlik yönlendirmeli stable diffusion model – Yaratıcı uygulamalar için yeni fikirlerle görüntüden görüntüye
Stability AI vardır serbest hakkında blogunda yeni bir makale Stable Diffusion 2. İçinde, Stability AI öncekinden daha verimli ve sağlam olan yeni bir algoritma önerirken diğer son teknoloji yöntemlerle karşılaştırır.
CompVis'in orijinali Stable Diffusion V1 modeli devrim açık kaynağın doğası AI modelleri ve dünya çapında yüzlerce farklı model ve gelişme üretti. Github'daki diğer programlardan daha hızlı, iki aydan kısa bir sürede 10,000'e ulaşan 33,000 Github yıldızına en hızlı tırmanışlardan birini gördü.
Özgün Stable Diffusion V1 sürümü, Robin Rombach'ın dinamik ekibi tarafından yönetildi (Stability AI) ve Prof. Dr. Björn Ommer liderliğindeki LMU Münih'teki CompVis Group'tan Patrick Esser (Runway ML). Latent ile laboratuvarın önceki çalışmasını temel aldılar Difüzyon Modelleri ve LAION ve Eleuther AI'dan kritik destek aldı.
Ne yapar Stable Diffusion v1 farklı Stable Diffusion v2?
Stable Diffusion 2.0, önceki sürüme göre bir dizi önemli geliştirme ve özellik içerir, bu yüzden onlara bir göz atalım.
The Stable Diffusion 2.0 sürümü, LAION tarafından geliştirilen yepyeni bir metin kodlayıcı (OpenCLIP) ile eğitilmiş sağlam metinden görüntüye modeller içerir. Stability AIkalitesini önemli ölçüde artıran, oluşturulan görüntüler önceki V1 sürümleri üzerinde. Bu sürümün metinden görüntüye modelleri, 512×512 piksel ve 768×768 piksel varsayılan çözünürlüklerde görüntüler çıkarabilir.
Bu modeller, LAION-5B veri kümesinin estetik bir alt kümesi kullanılarak eğitilir. Stability AIDeepFloyd ekibi, daha sonra LAION'un NSFW filtresini kullanarak yetişkinlere uygun içeriği hariç tutmak için filtrelenir.
50 DDIM örnek adımı, 50 sınıflandırıcı içermeyen rehber ölçek ve 1.5, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0 ve 8.0 kullanılarak yapılan değerlendirmeler, kontrol noktalarında göreli iyileştirmeler olduğunu gösterir:
Stable Diffusion 2.0 artık görüntü çözünürlüğünü dört kat artıran bir Yükseltici Difüzyon modelini içeriyor. Modelimizin bir örneği yükseltme düşük kalitede oluşturulan bir görüntünün (128×128) daha yüksek çözünürlüklü bir görüntüye (512×512) dönüştürülmesi aşağıda gösterilmiştir. Stable Diffusion 2.0, metinden görüntüye modellerimizle birleştirildiğinde artık 2048×2048 veya daha yüksek çözünürlüklü görüntüler üretebilir.
Yeni derinlik kılavuzlu stable diffusion model, deep2img, V1'deki önceki görüntüden görüntüye özelliğini tamamen yeni yaratıcı olanaklarla genişletir. Depth2img, bir girdi görüntüsünün derinliğini belirler (mevcut bir modeli kullanarak) ve ardından yeni görüntüleri hem metin hem de derinlik bilgisine dayalıdır. Görüntüye Derinlik, görüntünün tutarlılığını ve derinliğini korurken orijinalinden önemli ölçüde farklı görünen değişiklikler sunarak çok sayıda yeni yaratıcı uygulama sağlayabilir.
yenilikler Stable Diffusion 2?
- Yeni stable diffusion model 768×768 çözünürlük sunar.
- U-Net, sürüm 1.5 ile aynı miktarda parametreye sahiptir, ancak sıfırdan eğitilmiştir ve metin kodlayıcı olarak OpenCLIP-ViT/H kullanır. Sözde bir v-tahmin modeli SD 2.0-v'dir.
- Yukarıda belirtilen model, yine kullanıma sunulan ve 2.0×512 görüntülerde tipik bir gürültü tahmin modeli olarak eğitilen SD 512 tabanından ayarlanmıştır.
- x4 ölçekleme ile gizli bir metin kılavuzlu difüzyon modeli eklendi.
- Rafine SD 2.0 tabanlı derinlik kılavuzlu stable diffusion model. Model, yapıyı koruyan img2img ve şekil koşullu sentez için kullanılabilir ve MiDaS tarafından elde edilen monoküler derinlik tahminlerine göre koşullandırılır.
- SD 2.0 temeline dayalı geliştirilmiş metin kılavuzlu iç boyama modeli.
Geliştiriciler, tıpkı ilk yinelemede olduğu gibi çok çalıştı. Stable Diffusion, modeli tek bir GPU'da çalışacak şekilde optimize etmek için - en başından mümkün olduğunca çok kişi tarafından erişilebilir olmasını istediler. Milyonlarca kişi bu modelleri ele geçirdiğinde ve kesinlikle olağanüstü şeyler inşa etmek için işbirliği yaptığında neler olduğunu zaten gördüler. Bu, açık kaynağın gücüdür: son teknoloji bir modeli eğitecek kaynaklara sahip olmayan ancak bir modelle inanılmaz şeyler yapma becerisine sahip milyonlarca yetenekli insanın muazzam potansiyelinden yararlanmak.
Deep2img gibi güçlü yeni özellikler ve daha iyi çözünürlük yükseltme yetenekleriyle birleştirilen bu yeni güncelleme, çok sayıda yeni uygulamanın temelini oluşturacak ve yeni yaratıcı potansiyelin patlamasını sağlayacaktır.
Hakkında daha fazla bilgi Stable Diffusion:
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.
Daha fazla haberDamir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.