Meta, Yapay Zeka Görüntü Üretimini İyileştirmek için 'Emu'yu Tanıttı
Kısaca
Meta AI, samanlıktaki fotojenik iğneleri kullanarak görüntü oluşturma modellerini iyileştirmek için bir yöntem geliştirdi.
Süreç, 1024x1024 piksel çözünürlüğe ulaşmak için metin kodlayıcıları kullanarak geniş bir veri kümesi üzerinde bir yayılma modelinin ön eğitimini içerir.
Veri kümesi, insan uzmanlığının ortalamanın altındaki görüntüleri ayıkladığı kapsamlı bir filtrelemeye tabi tutulur.
Meta AI yakın zamanda paylaştı Araştırma kağıdı hizmetleri kapsamında çıkartma ve görsellerin oluşturulmasını geliştirmek için geliştirilen yeni bir yaklaşımı detaylandırıyor. “ başlıklı yazıEmu: Samanlıkta Fotojenik İğneler Kullanılarak Görüntü Oluşturma Modellerinin Geliştirilmesi,"Kaliteye göre ayarlanmış" bir eğitim yönteminin, küçük bir veri kümesinde bile görüntü oluşturma kalitesini nasıl önemli ölçüde artırabileceğini göstermeyi amaçlıyor.
metalar Eğitim Öncesi Yöntem ve Model Detayları
İlk aşama, Meta AI'nın dahili kaynaklarından 1.1 milyar görüntü-metin çifti içeren geniş bir veri kümesini kullanarak bir yayılma modelinin ön eğitimini içerir. Aşama, 2.8 milyar parametre içeren bir U-Net modeline dayanıyor. Modelle birlikte özellikle CLIP ViT-L ve T5-XXL olmak üzere metin kodlayıcılar kullanılıyor. Modelin nihai hedefi 1024×1024 piksel çözünürlükte bir görüntü oluşturmaktır.
Modelin veri seti, bir milyardan fazla örnekten oluşan havuzdan 200,000'den fazla örneği eleyerek sıkı bir filtrelemeye tabi tutulur. Görüntü estetiğini değerlendiren sınıflandırıcılar, istenmeyen içeriğin atılmasına yönelik mekanizmalar, metin ağırlıklı görüntülerin hariç tutulması için optik karakter tanıma (OCR) ve çözünürlük ve orantı bazlı filtreleme dahil olmak üzere çoklu filtreler uygulanır. Beğeniler gibi popülerlik ölçümleri de filtreleme sürecini etkiler.
İlgili bağlantılar: Meta, Üretken Emu Modelinden Akıllı Gözlüklere Kadar Hizmetler Arasında Yapay Zeka Entegrasyonunu Açıkladı |
Bu aşamada insan uzmanlığı ön plandadır. Veri açıklaması konusunda kapsamlı bir anlayışa sahip olan genelciler, kalan 200,000 görüntüyü değerlendirir ve 20,000'lik bir alt küme oluşturur. Buradaki temel amaç, önceki adımda kullanılan buluşsal yöntemlerin yetersiz olması durumunda, önemli ölçüde ortalamanın altında görüntüleri tanımlamak ve kaldırmaktır.
İlgili bağlantılar: Meta, Genişletilmiş Yaratıcılık için 28 AI Karakteri ve AI Studio'yu Tanıtıyor |
DAÜ'nün İmaj Üretme Becerisi
Fotoğrafik prensipler konusunda son derece bilgili fotoğraf uzmanlarından oluşan bir ekip, görüntülerin filtrelenmesi ve seçilmesi görevini üstlenir. Amaçları en yüksek estetik kaliteye sahip görüntüleri tespit etmek ve korumaktır. Kompozisyon, ışıklandırma, renk şemaları, kontrastlar, tematik alaka ve arka planlar gibi faktörleri titizlikle değerlendiriyorlar.
Son dokunuş, 2,000 görüntü-metin çiftinden oluşan bu seçilmiş veri kümesi için yüksek kaliteli metin açıklamalarının titizlikle işlenmesini içerir.
Son olarak model, 15,000 toplu iş boyutuyla 64 adımı tamamlayarak bu rafine edilmiş veri kümesi üzerinde eğitim yapar. Bu toplu iş boyutu, büyük toplu iş boyutuna kıyasla nispeten küçüktür. üretken modeller. Model, doğrulama kaybına bağlı olarak aşırı eğitilmiş gibi görünse de, insan değerlendirmeleri aksini gösteriyor. Dil modellerinde de benzer bir olgu gözlenmiştir.
Bu düzenlenmiş çok aşamalı süreç sayesinde Meta AI, yüksek kaliteye ulaşır görüntü üretimi. Bu metodoloji yalnızca hizmetlerinin pratik faydalarını artırmayı amaçlamakla kalmıyor, aynı zamanda yapay zeka tarafından oluşturulan içeriğin iyileştirilmesinde dikkatli düzenlemenin ve insan uzmanlığının öneminin altını çiziyor. Daha fazla ayrıntı için, tamamını keşfedebilirsiniz makale.
Daha fazla ilgili konu okuyun:
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.
Daha fazla haberDamir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.