Haber Raporu
20 Mart, 2023

Yeni Metinden Görüntüye Model GigaGAN, 4 Saniyede 3.66K Görüntüler Oluşturabilir

Kısaca

Araştırmacılar, 4 saniyede 3.66K görüntüler oluşturabilen GigaGAN adlı yeni bir metinden görüntüye model geliştirdiler.

Bir tür GAN (üretken çekişmeli ağ) çerçevesine dayanmaktadır. sinir ağı eğitim veri kümesine benzer veriler üretmeyi öğrenebilir. GigaGAN, önceki son teknoloji modele göre 512 kat daha hızlı, 0.13 saniyede 10 piksel görüntü üretebilmektedir ve çözülmüş, sürekli ve kontrol edilebilir bir gizli alana sahiptir.

Verimli, daha yüksek kaliteli bir üst örnekleyiciyi eğitmek için de kullanılabilir.

Araştırmacılar, adında yeni bir metinden görüntüye modeli geliştirdiler. GigaGAN üretebilen 4K resimleri 3.66 saniyede. Bu, tek bir görüntü oluşturmak için dakikalar hatta saatler sürebilen mevcut metinden görüntüye modellere göre büyük bir gelişmedir.

Yeni metinden görüntüye model GigaGAN, 4 saniyede 3.66K görüntüler oluşturabilir

GigaGAN, bir eğitim veri kümesine benzer veriler üretmeyi öğrenebilen bir tür sinir ağı olan GAN (üretken rakip ağ) çerçevesini temel alır. Yüzlerin, manzaraların ve hatta Sokak Görünümü görüntülerinin gerçekçi görüntülerini oluşturmak için GAN'lar kullanılmıştır.

Daha fazla oku: 5'ün En Çok Beklenen 2023+ Metinden Görüntüye Yapay Zeka modeli

Yeni model, önceki metinden görüntüye modelleri eğitmek için kullanılan veri kümelerinden çok daha büyük olan 1 milyar görüntüden oluşan bir veri kümesi üzerinde eğitildi. Sonuç olarak GigaGAN, önceki son teknoloji metinden görüntüye modelden 512 kat daha hızlı olan 0.13 saniyede 10 piksellik görüntüler üretebilir.

Ek olarak, GigaGAN çözülmüş, sürekli ve kontrol edilebilir gizli bir alana sahiptir. Bu, GigaGAN'ın çok çeşitli stillere sahip görüntüler üretebileceği ve oluşturulan görüntülerin bir dereceye kadar kontrol edilebileceği anlamına gelir. Örneğin GigaGAN, örneğin metin açıklamalarından ürün yerleşimlerinin görüntülerini oluştururken uygulamalar için önemli olan metin girişinin düzenini koruyan görüntüler oluşturabilir.

GigaGAN, verimli, daha yüksek kaliteli bir üst örnekleyiciyi eğitmek için de kullanılabilir. Bu, gerçek görüntülere veya diğer çıktılara uygulanabilir. metinden resme modeller.

Bir metin kodlama dalı, stil eşleme ağı, çok ölçekli sentez ağı ve kararlı dikkat ve uyarlanabilir çekirdek seçimi, tümü GigaGAN üretecinin parçalarıdır. Geliştiriciler, önceden eğitilmiş bir CLIP modeli ve öğrenilmiş dikkat katmanları T ile metin gömmelerini ayıklayarak metin kodlama dalına başlar. StilGAN, katıştırma, w stil vektörünü oluşturan stil eşleme ağına M iletilir. Bir görüntü piramidi oluşturmak için, sentez ağı artık modülasyon olarak stil kodunu ve dikkat olarak metin gömmelerini kullanıyor. Ayrıca geliştiriciler, giriş metni koşullandırmasına dayalı uyarlanabilir şekilde evrişim çekirdeklerini seçmek için örneğe uyarlanabilir çekirdek seçimini sunar.

Ayırıcı, jeneratör gibi, görüntü işleme ve metin koşullandırma için iki dala sahiptir. Metin dalı, oluşturucu gibi metni işler. Görüntü dalına bir görüntü piramidi verilir ve her görüntü ölçeği için bağımsız tahminler yapma görevi verilir. Ayrıca, sonraki tüm alt örnekleme katmanı ölçeklerinde tahminler yapılır. Etkili yakınsamayı teşvik etmek için ek kayıplar da kullanılır.

Enterpolasyon ızgarasında gösterildiği gibi GigaGAN, bilgi istemleri arasında sorunsuz enterpolasyona izin verir. Dört köşe, aynı gizli z ancak farklı metin istemleri kullanılarak oluşturulur.

GigaGAN çözülmüş bir gizli alanı koruduğu için, geliştiriciler bir örneğin kaba stilini diğerinin ince stiliyle birleştirebilir. GigaGAN, stili doğrudan metin istemleriyle de kontrol edebilir.

Daha fazla ilgili makale okuyun:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Daha fazla haber
Damir Yalalov
Damir Yalalov

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Hüküm Günü Geliyor: ABD Mahkemesi Adalet Bakanlığı'nın Savunmasını Değerlendirirken CZ'nin Kaderi Dengede

Changpeng Zhao bugün Seattle'daki bir ABD mahkemesinde cezayla karşı karşıya kalmaya hazırlanıyor.

bilmek Daha

Samourai Cüzdan Kurucuları, Darknet Anlaşmalarında 2 Milyar Dolarlık Kolaylık Sağlamakla Suçlanıyor

Samourai Cüzdan kurucularının tutuklanması, sektör için kayda değer bir gerilemeyi temsil ediyor ve ısrarcı tutumun altını çiziyor ...

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
Pantera Capital, TON Blockchain'e Yatırım Yapıyor ve Telegram'ın Kripto Erişilebilirliğini Genişletme Potansiyeline Güvendiğini İfade Ediyor
İşletme Haber Raporu Teknoloji
Pantera Capital, TON Blockchain'e Yatırım Yapıyor ve Telegram'ın Kripto Erişilebilirliğini Genişletme Potansiyeline Güvendiğini İfade Ediyor
Mayıs 2, 2024
Mitosis, Modüler Likidite Protokolünü Geliştirmek İçin Amber Group ve Foresight Ventures'tan 7 Milyon Dolarlık Finansman Sağladı
İşletme Haber Raporu Teknoloji
Mitosis, Modüler Likidite Protokolünü Geliştirmek İçin Amber Group ve Foresight Ventures'tan 7 Milyon Dolarlık Finansman Sağladı
Mayıs 2, 2024
Galxe, Küresel Erişilebilirliği Genişletmek İçin Jambo ile İşbirliği Yapıyor Web3
İşletme Haber Raporu Teknoloji
Galxe, Küresel Erişilebilirliği Genişletmek İçin Jambo ile İşbirliği Yapıyor Web3
Mayıs 2, 2024
Hong Kong Yasama Konseyi Üyesi Wu Jiezhuang, JPEX Kripto Borsasına Karşı Hukuk Davası Sinyali Verdi
İşletme Haber Raporu Teknoloji
Hong Kong Yasama Konseyi Üyesi Wu Jiezhuang, JPEX Kripto Borsasına Karşı Hukuk Davası Sinyali Verdi
Mayıs 2, 2024
CRYPTOMERIA LABS PTE. LTD.