GLIGEN: sınırlayıcı kutulu yeni donmuş metinden görüntüye oluşturma modeli
Kısaca
GLIGEN veya Grounded-Language-to-Image Generation, mevcut önceden eğitilmiş difüzyon modellerinin kapasitesini geliştiren ve geliştiren yeni bir tekniktir.
Altyazı ve sınırlayıcı kutu koşul girişleriyle, GLIGEN modeli açık dünya temelli text2img oluşturur.
GLIGEN, önceden eğitilmiş bir text2img modelinden elde edilen bilgilerden yararlanarak belirli yerlerde ve stillerde çeşitli nesneler üretebilir.
GLIGEN, metinden görüntüye oluştururken insan anahtar noktalarını da temel alabilir.
Büyük ölçekli metinden görüntüye difüzyon modelleri uzun bir yol kat etti. Bununla birlikte, mevcut uygulama, yalnızca kontrol edilebilirliği sınırlayabilen metin girişine güvenmektir. GLİGENveya Grounded-Language-to-Image Generation, mevcut önceden eğitilmiş metinden görüntüye difüzyon modellerinin topraklama girdilerine göre koşullandırılmalarına izin vererek bu modellerin kapasitesini geliştiren ve genişleten yeni bir tekniktir.
Önceden eğitilmiş modelin kapsamlı konsept bilgisini korumak için, geliştiriciler modelin tüm ağırlıklarını dondurur ve topraklama bilgilerini kontrollü bir süreç aracılığıyla yeni eğitilebilir katmanlara pompalar. Altyazı ve sınırlayıcı kutu koşulu girişleriyle, GLIGEN modeli açık dünya tabanlı metinden görüntüye oluşturur ve temellendirme yeteneği, yeni uzamsal konfigürasyonlara ve kavramlara etkili bir şekilde genelleşir.
Check out gösteri .
- GLIGEN, mevcut önceden eğitilmiş difüzyon modelleri, büyük miktarda önceden eğitilmiş bilgiyi korumak için orijinal ağırlıkları donduruldu.
- Her trafo bloğunda, ek topraklama girdisini emmek için yeni bir eğitilebilir Kapılı Öz-Dikkat katmanı oluşturulur.
- Her bir topraklama jetonunun iki tür bilgisi vardır: topraklanmış şey hakkında anlamsal bilgi (kodlanmış metin veya resim) ve uzamsal konum bilgisi (kodlanmış sınırlayıcı kutu veya anahtar noktalar).
İlgili makale: Microsoft, bir kişinin tek bir fotoğrafından 3D avatar oluşturabilen bir yayılma modeli yayınladı. |
AI hakkında daha fazlasını okuyun:
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.
Daha fazla haberDamir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.