Haber Raporu Teknoloji
17 Kasım 2022

Nvidia, eDiff-I'i duyurdu: Anında stil aktarımıyla metin ve görüntü sentezi için yeni üretken yapay zeka

Kısaca

Nvidia, işletmelerin yüksek kaliteli, ilgi çekici görüntüler oluşturmasına yardımcı olmak için eDiff-I'yi piyasaya sürdü

eDiff-I tekniği düzenli olarak DALL-E2'den daha yüksek sentez kalitesi üretir ve Stable diffusion

eDiff-I, yeni bir AI içerik oluşturma aracıdır. sağlar tarafından kısa süre önce duyurulduğu gibi, pazarlamacılar ve işletmeler için benzeri görülmemiş metinden görüntüye sentez yetenekleri Nvidia. eDiff-I ile işletmeler, pahalı ekipmana veya profesyonel yardıma ihtiyaç duymadan hızlı ve kolay bir şekilde yüksek kaliteli, ilgi çekici görseller oluşturabilir. eDiff-I, kullanıcının girişini yorumlamak ve karşılık gelen görüntüleri oluşturmak için doğal dil işlemeyi (NLP) kullanır. AI daha sonra görüntüleri analiz eder ve bağlama göre en uygun olanı seçer. Sonuç, pazarlama materyalleri, sosyal medya gönderileri, e-posta kampanyaları ve daha fazlası gibi çeşitli amaçlar için kullanılabilen yüksek kaliteli, profesyonel görünümlü bir görseldir.

eDiff-I bir yeni nesil üretken yapay zeka benzeri görülmemiş içerik oluşturma aracı metinden görüntüye sentez, hızlı stil aktarımı ve kelimelerle sezgisel boyama. Metinden görseller oluşturmak için bir yayılma modeli olarak, eDiff-I, yayılma modellerinin davranışının örneklemenin farklı aşamalarında değiştiğine dair ampirik bulguya yanıt olarak, her biri belirli bir gürültü aralığı için uzmanlaşmış bir uzman gürültü giderme ağları grubunun eğitilmesini önerir.

Nvidia, eDiff-I'i duyurdu: Anında stil aktarımıyla metin ve görüntü sentezi için yeni üretken yapay zeka

T5 metin yerleştirmeleri, CLIP görüntü yerleştirmeleri ve CLIP metin yerleştirmeleri, eDiff-I konseptinin temelini oluşturur. Bu metodoloji, herhangi bir metin sorgusuna yanıt olarak fotogerçekçi grafikler üretebilir.

Metinden görüntüye senteze ek olarak iki ek yetenek daha sunar: (1) bir referans stil görüntüsü kullanarak oluşturulan örneğin stilini kontrol etmemizi sağlayan stil aktarımı ve (2) "Kelimelerle Boya" aracı Bu, kullanıcıların tuval üzerine segmentasyon haritalarını boyayarak görüntüler oluşturmasına olanak tanır.

Boru Hattı
Boru Hattı

İşlem hattı üç difüzyon modelinden oluşur: 64×64 çözünürlüğe sahip örnekler oluşturabilen bir temel model ve resimleri sırasıyla 256×256 ve 1024×1024 çözünürlüklere kademeli olarak üst örnekleyebilen iki süper çözünürlüklü yığın. Modeller, giriş olarak bir başlık aldıktan sonra T5 XXL ve metin yerleştirmeyi hesaplar. Bu resim yerleştirmeleri bir stil vektörü olarak kullanılabilir. Daha sonra bu yerleştirmeleri basamaklı sistemimize besleyin. difüzyon modellerikademeli olarak 1024 x 1024 çözünürlükte görüntüler üretir.

eDiff-I yaklaşımı, açık kaynaklı metinden görüntüye algoritmalarla karşılaştırıldığında sürekli olarak daha iyi sentez kalitesi sağlar (Stable diffusion) ve (DALL-E2).

Sonuçlar
Sonuçlar

CLIP görüntü yerleştirmeleri kullanıldığında, eDiff-I yaklaşımı stil aktarımını kolaylaştırır. eDiff-I önce ayıklar CLIP bir stil referans vektörü olarak kullanılabilen bir referans stil görüntüsünden görüntü yerleştirmeleri. Aşağıdaki şekilde sol panelde stilistik bir referans görülebilir. Stil koşullandırma açıldığında sonuçlar orta panelde görüntülenir. Stil koşullandırma kapatıldığında sonuçlar sağdaki panelde görüntülenir. Stil koşullandırma uygulandığında, eDiff-I modeli, giriş başlığının stiline de uygun çıktılar oluşturur. Stil koşullandırma kapatıldığında, doğal görünen fotoğraflar üretilir.

Stil transferi
Stil transferi

eDiff-I yönteminin kullanıcıları, ifadeleri seçerek ve bunları görüntünün üzerine karalayarak, metin isteminde listelenen şeylerin yerleşimini değiştirebilir. Bundan sonra, model kullanır görüntü oluşturmak için bilgi istemi ve haritalar hem başlık hem de giriş haritasıyla uyumlu.

İlgili makaleleri okuyun:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Daha fazla haber
Damir Yalalov
Damir Yalalov

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Hüküm Günü Geliyor: ABD Mahkemesi Adalet Bakanlığı'nın Savunmasını Değerlendirirken CZ'nin Kaderi Dengede

Changpeng Zhao bugün Seattle'daki bir ABD mahkemesinde cezayla karşı karşıya kalmaya hazırlanıyor.

bilmek Daha

Samourai Cüzdan Kurucuları, Darknet Anlaşmalarında 2 Milyar Dolarlık Kolaylık Sağlamakla Suçlanıyor

Samourai Cüzdan kurucularının tutuklanması, sektör için kayda değer bir gerilemeyi temsil ediyor ve ısrarcı tutumun altını çiziyor ...

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
Pantera Capital, TON Blockchain'e Yatırım Yapıyor ve Telegram'ın Kripto Erişilebilirliğini Genişletme Potansiyeline Güvendiğini İfade Ediyor
İşletme Haber Raporu Teknoloji
Pantera Capital, TON Blockchain'e Yatırım Yapıyor ve Telegram'ın Kripto Erişilebilirliğini Genişletme Potansiyeline Güvendiğini İfade Ediyor
Mayıs 2, 2024
Mitosis, Modüler Likidite Protokolünü Geliştirmek İçin Amber Group ve Foresight Ventures'tan 7 Milyon Dolarlık Finansman Sağladı
İşletme Haber Raporu Teknoloji
Mitosis, Modüler Likidite Protokolünü Geliştirmek İçin Amber Group ve Foresight Ventures'tan 7 Milyon Dolarlık Finansman Sağladı
Mayıs 2, 2024
Galxe, Küresel Erişilebilirliği Genişletmek İçin Jambo ile İşbirliği Yapıyor Web3
İşletme Haber Raporu Teknoloji
Galxe, Küresel Erişilebilirliği Genişletmek İçin Jambo ile İşbirliği Yapıyor Web3
Mayıs 2, 2024
Google'ın Med-Gemini'si Bir Öncülük Yapmaya Hazır GPT-4 Sağlık Alanında Üstün Performansıyla
AI Wiki Haberler Yazılım Teknoloji
Google'ın Med-Gemini'si Bir Öncülük Yapmaya Hazır GPT-4 Sağlık Alanında Üstün Performansıyla
Mayıs 2, 2024
CRYPTOMERIA LABS PTE. LTD.