Microsoft, bir kişinin tek bir fotoğrafından 3D avatar oluşturabilen bir yayılma modeli yayınladı.
Kısaca
Bir kişinin yüzünün tek bir 2B görüntüsü, 3B Avatar Difüzyon makine öğrenimi tekniği kullanılarak bir 3B avatar oluşturmak için kullanılabilir.
Oyun veya diğer kullanımlar için kişinin gerçekçi bir 3D görünümünü sağlamak veya sanal gerçeklik (VR) veya artırılmış gerçeklik (AR) deneyimi sağlamak için kullanılabilir.
3D Avatar Diffusion, bir insan yüzünün tek bir 2D görüntüsünü alıp üç boyutlu (3D) bir avatar oluşturabilen bir makine öğrenimi algoritmasıdır. Avatar daha sonra bir sanal gerçeklik (VR) veya artırılmış gerçeklik (AR) deneyimi oluşturmak veya oyun oynamak veya başka amaçlar için kişinin gerçekçi bir 3D görünümünü sağlamak için kullanılabilir.
Difüzyon modeli şuydu: gelişmiş Microsoft Research'teki bir araştırmacı ekibi tarafından ve dergide yayınlanan bir makalede açıklanmıştır. arXiv.
3D Avatar Yayılımı, yayılma modeli adı verilen bir tür makine öğrenimi algoritmasına dayanır. Difüzyon modelleri üretken modellerdir, yani eğitim verilerine benzer yeni veriler üretebilirler. Difüzyon modelleri Daha önce 3B görüntülerden 2B görüntüler oluşturmak için kullanılmıştı, ancak ADM, tek bir 3B görüntüden gerçekçi bir 2B avatar oluşturabilen ilk difüzyon modelidir.
Modeli eğitmek için araştırmacılar 200,000'den fazla 3B yüz modelinden oluşan bir veri seti kullandılar. Veri seti, farklı cilt tonlarına, saç stillerine ve yüz özelliklerine sahip çok çeşitli yüzleri içeriyordu. ADM daha sonra 2B görüntü ile 3B yüz modeli arasındaki ilişkiyi öğrenebildi ve tek bir 3B görüntüden gerçekçi bir 2B avatar oluşturabildi.
Model, farklı bir açıdan çekilmiş bir fotoğraftan bir avatar oluşturmak için de kullanılabilir.
Bu çalışma, difüzyon modellerini kullanarak nöral parlaklık alanları olarak temsil edilen 3B dijital avatarları otomatik olarak oluşturan bir 3B üretken model önermektedir. 3B ile ilişkili engelleyici bellek ve işleme gereksinimleri nedeniyle, yüksek kaliteli avatarlar için gerekli olan zengin özelliklerin oluşturulması çok büyük bir sorundur. Geliştiriciler, yaygınlaştırma difüzyon ağının (Rodin) bu sorunu çözmesini önerir.
Bu ağ, bir nöral parlaklık alanının çok sayıda 2B özellik haritasını tek bir 2B özellik düzleminde sunar ve burada model daha sonra 3B farkındalı difüzyon gerçekleştirir. Rodin modeli, 3B'de difüzyonun bütünlüğünü korurken çok ihtiyaç duyulan hesaplama verimliliğini sağlamak için 2B özellik düzleminde yansıtılan özellikleri 3B'deki orijinal ilişkilerine göre ele alan 3B'ye duyarlı evrişimi kullanır.
AI hakkında daha fazlasını okuyun:
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.
Daha fazla haberDamir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.