Metinden SVG'ye: Berkeley piksel tabanlı difüzyon modelini soyutladığını duyurdu
Kısaca
Metinden görüntüye sentez - UC Berkeley araştırmacıları, metin koşullu vektör grafiklerini gösteriyor difüzyon modelleri
Metinden görüntüye sentezde, difüzyon modelleri gösterdi olağanüstü sonuçlar. Difüzyon modelleri, açıklamalı resimlerden oluşan muazzam veritabanlarını kullanarak son derece çeşitli nesnelerin ve durumların raster görüntülerini üretmeyi öğrenir. Bununla birlikte, dijital simgeler, grafikler ve çıkartmalar için tasarımcılar tipik olarak Ölçeklenebilir Vektör Grafikleri (SVG'ler) gibi görüntülerin vektör temsillerini kullanır. Vektör grafikleri küçüktür ve herhangi bir boyuta ölçeklendirilebilir.
UC Berkeley, resim piksel temsilleri üzerinde eğitilmiş metin koşullu bir difüzyon modeli kullanarak SVG olarak dışa aktarılabilen vektör grafiklerinin nasıl üretileceğini gösteriyor. Bunu, altyazılı kapsamlı SVG koleksiyonlarını kullanmadan gerçekleştirir. Bunun yerine, Berkeley araştırmacıları bir metinden görüntüye difüzyon Metinden 3B'ye sentezleme konusundaki son çalışmalarla motive edilen Skor Damıtma Örnekleme kaybıyla örnekleyin ve ince ayar yapın.
Örnek oluşturulmuş vektörler
Yeni oluşturulan SVG galerisine göz atın okuyun.
Vektör grafikleri küçüktür ancak herhangi bir boyuta ölçeklendirildiğinde keskinliklerini korurlar. Berkeley'deki araştırmacılar, vektör grafiklerini optimize etmek için Puan Damıtma Örneklemesine dayalı bir görüntü-metin kaybını iyileştirdiler. VectorFusion tarafından kullanılan DiffVG farklılaştırılabilir SVG oluşturucu, ters görselleri mümkün kılar.
Ek olarak VectorFusion, daha etkili ve daha kaliteli çok aşamalı bir yapılandırmaya olanak tanır. Bu yöntem, tarama örneklerinin alınmasıyla başlar. metinden görüntüye yayılma modeli denilen Stable Diffusion. Numuneler daha sonra LIVE kullanılarak VectorFusion tarafından otomatik olarak izlenir. Ancak bu örnekler sıklıkla ayrıntıdan yoksundur, sıkıcıdır veya vektör grafiklerine uyarlanması zordur. Puan Damıtma Örneklemesi yoluyla canlılığı ve metin tutarlılığını artırma.
VectorFusion, SVG yollarını bir ızgaradaki karelerle sınırlayarak eski video oyunları tarzında piksel sanatı üretebilir.
Bu yaklaşım, metinden eskiz oluşturmayı desteklemek için kolaylıkla genişletilebilir. Kullanıcı tarafından sağlanan metni doğru bir şekilde temsil eden soyut bir çizgi çizmeyi öğrenmek için önce rastgele seçilmiş 16 çizgi çiziyoruz. Ardından, gizli Puan Damıtma Örnekleme kaybımızı optimize ederiz.
İlgili makaleleri okuyun:
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.
Daha fazla haberDamir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.