Haber Raporu Teknoloji
10 Nisan 2023

Stability AI SDXL Beta Adında Yeni Bir Model Çıkardı

Kısaca

Stability AI SDXL Beta adlı yeni bir model yayınladı (Stable Diffusion XL Beta). Daha fazla parametreye ve bazı bilinmeyen geliştirmelere sahip daha büyük bir modeldir. DreamStudio'da mevcuttur, Stability AI'nin resmi görüntü oluşturucusudur ve çarpıcı görseller oluşturmak için gelişmiş algoritmalar ve derin öğrenme teknikleri kullanır.

Stability AI kısaltması olan SDXL Beta adlı yeni bir modelin önizlemesini yayınladı. Stable Diffusion XL Beta. Şu ana kadar şirket, modelle ilgili çok fazla bilgi paylaşmadı ancak isteyen herkes için teste açıldı. Bu SDXL modelinin nesi yeni? stable diffusion? Avantajları ve dezavantajları nelerdir? Hadi araştıralım.

Daha fazla oku: Midjourney ve Dall-E Artist Styles Dökümü ve Örnekler: 130 Ünlü Yapay Zeka Boyama Tekniği

SDXL modeli tam olarak nedir?

SDXL modeli şu anda kullanılmakta olan yeni bir modeldir. eğitimli. Henüz bitmesine çok az kaldı ve çıktığı zaman hakkında pek çok detay değişebilir; tüm bildiğimiz kadarıyla buna SDXL modeli bile denmeyebilir. Tek bildiğimiz, daha fazla parametreye ve bazı bilinmeyen iyileştirmelere sahip daha büyük bir model olduğu. Bu bir v2 modelidir, v3 modeli değil (ne anlama geliyorsa). v2 modelindeki geliştirmelerin sistem performansını iyileştirmesi mümkündür, ancak daha fazla bilgi olmadan bu iyileştirmelerin ne kadar önemli olabileceğini belirlemek zordur. Ek olarak, bu sürümde hangi belirli parametrelerin eklendiğini veya ayarlandığını bilmek yararlı olacaktır.

SDXL modeli şu anda DreamStudio'da mevcuttur. Stability AI'nin resmi görüntü oluşturucusu. Kontrol etmek için model menüsünden SDXL Beta'yı seçin. Gelişmiş algoritmalar kullanıyor gibi görünüyor ve derin öğrenme teknikleri geniş bir uygulama yelpazesi için mükemmel olan çarpıcı görseller oluşturmak için.

SDXL modeli tam olarak nedir?

İyileştirmeler

Okunabilir metin. SDXL okunaklı metin üretebilir ve mevcut v1 ve v2.1 modellerinde mümkün olmadığı için muhtemelen en çarpıcı özelliğidir. SDXL'in oluşturduğu metin, aşağıda görebileceğiniz gibi her zaman doğru değildir. Stable Diffusion Aşağıdaki metin. Ancak bırakın v2.1 modelini, v1'den çok daha üstün. Bunun nedeni, SDXL'lerin daha karmaşık dil yapılarını anlamasını ve oluşturmasını sağlayan daha gelişmiş bir derin öğrenme algoritması kullanmasıdır. Daha fazla geliştirme ile daha da doğru ve güvenilir olma potansiyeline sahiptir.

Komut istemi: "Sahte Olmaz" yazan beyaz bir kağıt tutan bir beyefendinin fotoğrafı
Komut istemi: "Sahte Olmaz" yazan beyaz bir kağıt tutan bir beyefendinin fotoğrafı
Elinde beyaz yazı tipleriyle "Şaka Yok" yazan siyah bir tabela tutan kızıl saçlı bir kadının fotoğrafı
Komut istemi: Elinde beyaz yazı tipleriyle "Şaka Yok" yazan siyah bir tabela tutan kızıl saçlı bir kadının fotoğrafı
İstemi: Üzerinde "Acı ve Uçak" yazan bir tabak tutan bir sinemada oturan Çinli bir kadının fotoğrafı.
İstemi: Üzerinde "Acı ve Uçak" yazan bir tabak tutan bir sinemada oturan Çinli bir kadının fotoğrafı.

İnsan anatomisi. Anatomik olarak doğru insan figürlerinin doğru üretimi, uzun süredir bilim insanları için bir zorluk olmuştur. stable diffusion. Ek veya eksik uzuvların varlığı yaygındır. İç boyama genellikle bunları düzeltmek için kullanılır veya daha yakın zamanda, bir referans görüntüden bir pozu çoğaltmak için ControlNet'in Açık Poz özelliğini kullanabilirsiniz. SDXL Beta modelinin geliştiği noktanın burası olduğunu memnuniyetle belirtiyoruz. SDXL Beta modeli, referans görüntülerden alınan pozların doğru bir şekilde kopyalanmasında önemli bir gelişme göstermiştir. Bu, animasyon ve sanal gerçeklik gibi çeşitli uygulamalar için değerli bir araç olabilir.

Topu sağ elinde döndüren spor kıyafeti giymiş bir kadının fotoğrafı
Komut istemi: Spor kıyafeti giymiş bir kadının sağ elinde top döndürme fotoğrafı
Kırmızı ayın altında oturan bir çocuğun fotoğrafı
İstemi: Kırmızı ayın altında oturan bir çocuğun fotoğrafı
Komut istemi: Bir fotoğraf, ormanda koşan yaşlı bir adamı gösteriyor.

Portre stili. SDXL Beta, fotoğraf gibi görünen mükemmel portreler üretir - sürüm 1.5'e kıyasla bir yükseltmedir. SDXL Beta'daki geliştirilmiş algoritma, portrelerin ayrıntılarını ve renk doğruluğunu iyileştirerek daha doğal ve gerçekçi bir görünüm sağlar. Kullanıcılar ayrıca arzu ettikleri efektleri elde etmek için keskinlik ve doygunluk seviyelerini ayarlayabilirler.

Komut istemi: bir erkek ve kız resmi
Komut istemi: bir erkek ve kız resmi
Komut istemi: şişman bir adamın portre fotoğrafı
Komut istemi: şişman bir adamın portre fotoğrafı
Komut istemi: 80'lerden bir kadının fotoğraf çekimi
Komut istemi: 80'lerden bir kadının fotoğraf çekimi

çift ​​ton Çift ton anahtar sözcüğü, v1.5 modelinde her zaman siyah beyaz fotoğraflar üretir. Ancak şimdi, SDXL Beta tarafından üretilen çift tonlu görüntüler çeşitli renklerde geliyor. Açıktır ki, v1 modelleriyle karşılaştırıldığında, istemi yorumla geliştirilmiş, v2 modellerinden daha doğru ve ilgili yanıtların alınmasıyla sonuçlanarak, onları doğal dil işleme görevleri için daha güvenilir bir araç haline getirmiştir.

bir köpeğin çift tonlu stil portresi
Komut istemi: bir köpeğin çift tonlu stil portresi
adanın çift tonlu manzarası
Komut istemi: adanın çift tonlu manzarası
genç afrikalı kadının çift tonlu portresi
Komut istemi: genç Afrikalı kadının çift tonlu portresi

Sanatsal stiller. Bazı küçük ayarlamalar yapıldı, ancak benzersiz oldukları için yeni modelin daha iyi sonuçlar sağlayıp sağlamadığını belirlemek zor. Bu ayarlamaların bir kişisel tercih veya sübjektif görüş meselesi olması muhtemeldir ve bu da bir karar vermeyi zorlaştırır. defikaliteleri hakkında nihai yargı. Bununla birlikte, ayarlamaların benzersizliği kayda değer olabilir ve daha fazla keşfedilmeye değer olabilir.

New York, Ivan Aivazovsky
v 1.5: New York, Ivan Aivazovsky
New York, Ivan Aivazovsky
SDXL: New York, Ivan Aivazovsky
Yaşlı Orman, Christopher Balaskas
v 1.5: Eski Orman, Christopher Balaskas
Yaşlı Orman, Christopher Balaskas
SDXL: Eski Orman, Christopher Balaskas

Sonuç

  • Stable Diffusion sonunda mantıklı bir metin üretebilir.
  • SDXL, v2.1 ve (daha az ölçüde) v1.5 modellerinden estetik açıdan daha hoş görüntüler sağlar.
  • Yeni model, daha doğru görüntüler üretiyor.
  • İnsan anatomisi gelişmiştir.
  • Olumsuz bilgi istemleri v2.1'deki kadar gerekli değildir.
  • Gerçekçi portreler oluşturabilir.
  • Modeldeki bazı tuhaflıklar yayınlanmadan önce düzeltilecektir.

Daha fazla ilgili makale okuyun:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Daha fazla haber
Damir Yalalov
Damir Yalalov

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Hüküm Günü Geliyor: ABD Mahkemesi Adalet Bakanlığı'nın Savunmasını Değerlendirirken CZ'nin Kaderi Dengede

Changpeng Zhao bugün Seattle'daki bir ABD mahkemesinde cezayla karşı karşıya kalmaya hazırlanıyor.

bilmek Daha

Samourai Cüzdan Kurucuları, Darknet Anlaşmalarında 2 Milyar Dolarlık Kolaylık Sağlamakla Suçlanıyor

Samourai Cüzdan kurucularının tutuklanması, sektör için kayda değer bir gerilemeyi temsil ediyor ve ısrarcı tutumun altını çiziyor ...

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
Ankr, Yapay Zeka İçin Bitcoin Likiditesinin Kilidini Açmak İçin Yapay Zeka Blockchain Platformu Talus Ağı ile İşbirliği Yapıyor
İşletme Haber Raporu Teknoloji
Ankr, Yapay Zeka İçin Bitcoin Likiditesinin Kilidini Açmak İçin Yapay Zeka Blockchain Platformu Talus Ağı ile İşbirliği Yapıyor
Mayıs 1, 2024
Binance Labs, Facebook'un Blok Zincirleri Arasındaki Move Entegrasyonunu Kolaylaştırmak İçin Hareket Laboratuvarlarını Destekliyor
İşletme Haber Raporu Teknoloji
Binance Labs, Facebook'un Blok Zincirleri Arasındaki Move Entegrasyonunu Kolaylaştırmak İçin Hareket Laboratuvarlarını Destekliyor
Mayıs 1, 2024
BRICS Nations Eye Stablecoin Ticaret Çözümü
İşletme Piyasalar Hikayeler ve İncelemeler Teknoloji
BRICS Nations Eye Stablecoin Ticaret Çözümü
Mayıs 1, 2024
Bitcoin L2 Ağı BOB, Gelişmiş İşlevsellik İçin LayerZero ile Bütünleşiyor
İşletme Haber Raporu Teknoloji
Bitcoin L2 Ağı BOB, Gelişmiş İşlevsellik İçin LayerZero ile Bütünleşiyor
Mayıs 1, 2024
CRYPTOMERIA LABS PTE. LTD.