Haber Raporu Teknoloji
Eylül 28, 2023

Meta, Yapay Zeka Görüntü Üretimini İyileştirmek için 'Emu'yu Tanıttı

Kısaca

Meta AI, samanlıktaki fotojenik iğneleri kullanarak görüntü oluşturma modellerini iyileştirmek için bir yöntem geliştirdi.

Süreç, 1024x1024 piksel çözünürlüğe ulaşmak için metin kodlayıcıları kullanarak geniş bir veri kümesi üzerinde bir yayılma modelinin ön eğitimini içerir.

Veri kümesi, insan uzmanlığının ortalamanın altındaki görüntüleri ayıkladığı kapsamlı bir filtrelemeye tabi tutulur.

Emu: Meta Yapay Zekanın Görüntü Oluşturma Modellerini Geliştirmeye Yönelik Yenilikçi Yaklaşımı

Meta AI yakın zamanda paylaştı Araştırma kağıdı hizmetleri kapsamında çıkartma ve görsellerin oluşturulmasını geliştirmek için geliştirilen yeni bir yaklaşımı detaylandırıyor. “ başlıklı yazıEmu: Samanlıkta Fotojenik İğneler Kullanılarak Görüntü Oluşturma Modellerinin Geliştirilmesi,"Kaliteye göre ayarlanmış" bir eğitim yönteminin, küçük bir veri kümesinde bile görüntü oluşturma kalitesini nasıl önemli ölçüde artırabileceğini göstermeyi amaçlıyor.

metalar Eğitim Öncesi Yöntem ve Model Detayları

İlk aşama, Meta AI'nın dahili kaynaklarından 1.1 milyar görüntü-metin çifti içeren geniş bir veri kümesini kullanarak bir yayılma modelinin ön eğitimini içerir. Aşama, 2.8 milyar parametre içeren bir U-Net modeline dayanıyor. Modelle birlikte özellikle CLIP ViT-L ve T5-XXL olmak üzere metin kodlayıcılar kullanılıyor. Modelin nihai hedefi 1024×1024 piksel çözünürlükte bir görüntü oluşturmaktır.

Modelin veri seti, bir milyardan fazla örnekten oluşan havuzdan 200,000'den fazla örneği eleyerek sıkı bir filtrelemeye tabi tutulur. Görüntü estetiğini değerlendiren sınıflandırıcılar, istenmeyen içeriğin atılmasına yönelik mekanizmalar, metin ağırlıklı görüntülerin hariç tutulması için optik karakter tanıma (OCR) ve çözünürlük ve orantı bazlı filtreleme dahil olmak üzere çoklu filtreler uygulanır. Beğeniler gibi popülerlik ölçümleri de filtreleme sürecini etkiler.

İlgili bağlantılar: Meta, Üretken Emu Modelinden Akıllı Gözlüklere Kadar Hizmetler Arasında Yapay Zeka Entegrasyonunu Açıkladı

Bu aşamada insan uzmanlığı ön plandadır. Veri açıklaması konusunda kapsamlı bir anlayışa sahip olan genelciler, kalan 200,000 görüntüyü değerlendirir ve 20,000'lik bir alt küme oluşturur. Buradaki temel amaç, önceki adımda kullanılan buluşsal yöntemlerin yetersiz olması durumunda, önemli ölçüde ortalamanın altında görüntüleri tanımlamak ve kaldırmaktır.

İlgili bağlantılar: Meta, Genişletilmiş Yaratıcılık için 28 AI Karakteri ve AI Studio'yu Tanıtıyor

DAÜ'nün İmaj Üretme Becerisi

Fotoğrafik prensipler konusunda son derece bilgili fotoğraf uzmanlarından oluşan bir ekip, görüntülerin filtrelenmesi ve seçilmesi görevini üstlenir. Amaçları en yüksek estetik kaliteye sahip görüntüleri tespit etmek ve korumaktır. Kompozisyon, ışıklandırma, renk şemaları, kontrastlar, tematik alaka ve arka planlar gibi faktörleri titizlikle değerlendiriyorlar.

Son dokunuş, 2,000 görüntü-metin çiftinden oluşan bu seçilmiş veri kümesi için yüksek kaliteli metin açıklamalarının titizlikle işlenmesini içerir.

Son olarak model, 15,000 toplu iş boyutuyla 64 adımı tamamlayarak bu rafine edilmiş veri kümesi üzerinde eğitim yapar. Bu toplu iş boyutu, büyük toplu iş boyutuna kıyasla nispeten küçüktür. üretken modeller. Model, doğrulama kaybına bağlı olarak aşırı eğitilmiş gibi görünse de, insan değerlendirmeleri aksini gösteriyor. Dil modellerinde de benzer bir olgu gözlenmiştir.

Bu düzenlenmiş çok aşamalı süreç sayesinde Meta AI, yüksek kaliteye ulaşır görüntü üretimi. Bu metodoloji yalnızca hizmetlerinin pratik faydalarını artırmayı amaçlamakla kalmıyor, aynı zamanda yapay zeka tarafından oluşturulan içeriğin iyileştirilmesinde dikkatli düzenlemenin ve insan uzmanlığının öneminin altını çiziyor. Daha fazla ayrıntı için, tamamını keşfedebilirsiniz makale.

Aynı istemler için bir nesil örneği. Solda 1. adımdan sonraki model (yani, verilerle uğraşmadan sadece ön eğitim) ve sağda tüm prosedürlerin üzerinden geçtikten sonraki model yer alıyor.

Daha fazla ilgili konu okuyun:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Daha fazla haber
Damir Yalalov
Damir Yalalov

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Volatilite Ortasında Bitcoin ETF'lerine Yönelik Kurumsal İştah Artıyor

13F başvuruları aracılığıyla yapılan açıklamalar, önemli kurumsal yatırımcıların Bitcoin ETF'leriyle uğraştığını ortaya koyuyor ve Bitcoin ETF'lerinin artan bir şekilde kabul edildiğinin altını çiziyor.

bilmek Daha

Hüküm Günü Geliyor: ABD Mahkemesi Adalet Bakanlığı'nın Savunmasını Değerlendirirken CZ'nin Kaderi Dengede

Changpeng Zhao bugün Seattle'daki bir ABD mahkemesinde cezayla karşı karşıya kalmaya hazırlanıyor.

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
Espresso Systems, Toplamanın Birlikte Çalışabilirliğini Artırmak İçin AggLayer'ı Geliştirmek İçin Polygon Laboratuvarlarıyla İşbirliği Yapıyor
İşletme Haber Raporu Teknoloji
Espresso Systems, Toplamanın Birlikte Çalışabilirliğini Artırmak İçin AggLayer'ı Geliştirmek İçin Polygon Laboratuvarlarıyla İşbirliği Yapıyor
Mayıs 9, 2024
ZKP Destekli Altyapı Protokolü ZKBase Yol Haritasını Açıkladı, Mayıs Ayında Testnet Lansmanını Planlıyor
Haber Raporu Teknoloji
ZKP Destekli Altyapı Protokolü ZKBase Yol Haritasını Açıkladı, Mayıs Ayında Testnet Lansmanını Planlıyor
Mayıs 9, 2024
BLOCKCHANCE ve CONF3RENCE Almanya'nın En Büyükleri için Birleşiyor Web3 Dortmund'daki konferans
İşletme Piyasalar Yazılım Hikayeler ve İncelemeler Teknoloji
BLOCKCHANCE ve CONF3RENCE Almanya'nın En Büyükleri için Birleşiyor Web3 Dortmund'daki konferans
Mayıs 9, 2024
NuLink Bybit'te Başlıyor Web3 İDO Platformu. Abonelik Aşaması 13 Mayıs'a Kadar Uzatılıyor
Piyasalar Haber Raporu Teknoloji
NuLink Bybit'te Başlıyor Web3 İDO Platformu. Abonelik Aşaması 13 Mayıs'a Kadar Uzatılıyor
Mayıs 9, 2024
CRYPTOMERIA LABS PTE. LTD.