Nvidia, eDiff-I'i duyurdu: Anında stil aktarımıyla metin ve görüntü sentezi için yeni üretken yapay zeka
Kısaca
Nvidia, işletmelerin yüksek kaliteli, ilgi çekici görüntüler oluşturmasına yardımcı olmak için eDiff-I'yi piyasaya sürdü
eDiff-I tekniği düzenli olarak DALL-E2'den daha yüksek sentez kalitesi üretir ve Stable diffusion
eDiff-I, yeni bir AI içerik oluşturma aracıdır. sağlar tarafından kısa süre önce duyurulduğu gibi, pazarlamacılar ve işletmeler için benzeri görülmemiş metinden görüntüye sentez yetenekleri Nvidia. eDiff-I ile işletmeler, pahalı ekipmana veya profesyonel yardıma ihtiyaç duymadan hızlı ve kolay bir şekilde yüksek kaliteli, ilgi çekici görseller oluşturabilir. eDiff-I, kullanıcının girişini yorumlamak ve karşılık gelen görüntüleri oluşturmak için doğal dil işlemeyi (NLP) kullanır. AI daha sonra görüntüleri analiz eder ve bağlama göre en uygun olanı seçer. Sonuç, pazarlama materyalleri, sosyal medya gönderileri, e-posta kampanyaları ve daha fazlası gibi çeşitli amaçlar için kullanılabilen yüksek kaliteli, profesyonel görünümlü bir görseldir.
eDiff-I bir yeni nesil üretken yapay zeka benzeri görülmemiş içerik oluşturma aracı metinden görüntüye sentez, hızlı stil aktarımı ve kelimelerle sezgisel boyama. Metinden görseller oluşturmak için bir yayılma modeli olarak, eDiff-I, yayılma modellerinin davranışının örneklemenin farklı aşamalarında değiştiğine dair ampirik bulguya yanıt olarak, her biri belirli bir gürültü aralığı için uzmanlaşmış bir uzman gürültü giderme ağları grubunun eğitilmesini önerir.
T5 metin yerleştirmeleri, CLIP görüntü yerleştirmeleri ve CLIP metin yerleştirmeleri, eDiff-I konseptinin temelini oluşturur. Bu metodoloji, herhangi bir metin sorgusuna yanıt olarak fotogerçekçi grafikler üretebilir.
Metinden görüntüye senteze ek olarak iki ek yetenek daha sunar: (1) bir referans stil görüntüsü kullanarak oluşturulan örneğin stilini kontrol etmemizi sağlayan stil aktarımı ve (2) "Kelimelerle Boya" aracı Bu, kullanıcıların tuval üzerine segmentasyon haritalarını boyayarak görüntüler oluşturmasına olanak tanır.
İşlem hattı üç difüzyon modelinden oluşur: 64×64 çözünürlüğe sahip örnekler oluşturabilen bir temel model ve resimleri sırasıyla 256×256 ve 1024×1024 çözünürlüklere kademeli olarak üst örnekleyebilen iki süper çözünürlüklü yığın. Modeller, giriş olarak bir başlık aldıktan sonra T5 XXL ve metin yerleştirmeyi hesaplar. Bu resim yerleştirmeleri bir stil vektörü olarak kullanılabilir. Daha sonra bu yerleştirmeleri basamaklı sistemimize besleyin. difüzyon modellerikademeli olarak 1024 x 1024 çözünürlükte görüntüler üretir.
eDiff-I yaklaşımı, açık kaynaklı metinden görüntüye algoritmalarla karşılaştırıldığında sürekli olarak daha iyi sentez kalitesi sağlar (Stable diffusion) ve (DALL-E2).
CLIP görüntü yerleştirmeleri kullanıldığında, eDiff-I yaklaşımı stil aktarımını kolaylaştırır. eDiff-I önce ayıklar CLIP bir stil referans vektörü olarak kullanılabilen bir referans stil görüntüsünden görüntü yerleştirmeleri. Aşağıdaki şekilde sol panelde stilistik bir referans görülebilir. Stil koşullandırma açıldığında sonuçlar orta panelde görüntülenir. Stil koşullandırma kapatıldığında sonuçlar sağdaki panelde görüntülenir. Stil koşullandırma uygulandığında, eDiff-I modeli, giriş başlığının stiline de uygun çıktılar oluşturur. Stil koşullandırma kapatıldığında, doğal görünen fotoğraflar üretilir.
eDiff-I yönteminin kullanıcıları, ifadeleri seçerek ve bunları görüntünün üzerine karalayarak, metin isteminde listelenen şeylerin yerleşimini değiştirebilir. Bundan sonra, model kullanır görüntü oluşturmak için bilgi istemi ve haritalar hem başlık hem de giriş haritasıyla uyumlu.
İlgili makaleleri okuyun:
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.
Daha fazla haberDamir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.