Haber Raporu Teknoloji
Ocak 18, 2023

Microsoft, bir kişinin tek bir fotoğrafından 3D avatar oluşturabilen bir yayılma modeli yayınladı.

Kısaca

Bir kişinin yüzünün tek bir 2B görüntüsü, 3B Avatar Difüzyon makine öğrenimi tekniği kullanılarak bir 3B avatar oluşturmak için kullanılabilir.

Oyun veya diğer kullanımlar için kişinin gerçekçi bir 3D görünümünü sağlamak veya sanal gerçeklik (VR) veya artırılmış gerçeklik (AR) deneyimi sağlamak için kullanılabilir.

3D Avatar Diffusion, bir insan yüzünün tek bir 2D görüntüsünü alıp üç boyutlu (3D) bir avatar oluşturabilen bir makine öğrenimi algoritmasıdır. Avatar daha sonra bir sanal gerçeklik (VR) veya artırılmış gerçeklik (AR) deneyimi oluşturmak veya oyun oynamak veya başka amaçlar için kişinin gerçekçi bir 3D görünümünü sağlamak için kullanılabilir.

Difüzyon modeli şuydu: gelişmiş Microsoft Research'teki bir araştırmacı ekibi tarafından ve dergide yayınlanan bir makalede açıklanmıştır. arXiv.

Microsoft, bir kişinin tek bir fotoğrafından 3D avatar oluşturabilen bir yayılma modeli yayınladı.

3D Avatar Yayılımı, yayılma modeli adı verilen bir tür makine öğrenimi algoritmasına dayanır. Difüzyon modelleri üretken modellerdir, yani eğitim verilerine benzer yeni veriler üretebilirler. Difüzyon modelleri Daha önce 3B görüntülerden 2B görüntüler oluşturmak için kullanılmıştı, ancak ADM, tek bir 3B görüntüden gerçekçi bir 2B avatar oluşturabilen ilk difüzyon modelidir.

Modeli eğitmek için araştırmacılar 200,000'den fazla 3B yüz modelinden oluşan bir veri seti kullandılar. Veri seti, farklı cilt tonlarına, saç stillerine ve yüz özelliklerine sahip çok çeşitli yüzleri içeriyordu. ADM daha sonra 2B görüntü ile 3B yüz modeli arasındaki ilişkiyi öğrenebildi ve tek bir 3B görüntüden gerçekçi bir 2B avatar oluşturabildi.

Model, farklı bir açıdan çekilmiş bir fotoğraftan bir avatar oluşturmak için de kullanılabilir.

Kişiselleştirilmiş 3B avatar için Rodin modeli, metin kılavuzlu manipülasyon sunar. Doğal dil düzenleme, birçok farklı 3B avatar özelliğini değiştirmenin sezgisel bir yoludur.

Bu çalışma, difüzyon modellerini kullanarak nöral parlaklık alanları olarak temsil edilen 3B dijital avatarları otomatik olarak oluşturan bir 3B üretken model önermektedir. 3B ile ilişkili engelleyici bellek ve işleme gereksinimleri nedeniyle, yüksek kaliteli avatarlar için gerekli olan zengin özelliklerin oluşturulması çok büyük bir sorundur. Geliştiriciler, yaygınlaştırma difüzyon ağının (Rodin) bu sorunu çözmesini önerir.

Model, cinsiyet, yaş, ırk, ifade, yüz aksesuarları vb. açısından olağanüstü bir kuşaksal çeşitlilik sergiliyor.​

Bu ağ, bir nöral parlaklık alanının çok sayıda 2B özellik haritasını tek bir 2B özellik düzleminde sunar ve burada model daha sonra 3B farkındalı difüzyon gerçekleştirir. Rodin modeli, 3B'de difüzyonun bütünlüğünü korurken çok ihtiyaç duyulan hesaplama verimliliğini sağlamak için 2B özellik düzleminde yansıtılan özellikleri 3B'deki orijinal ilişkilerine göre ele alan 3B'ye duyarlı evrişimi kullanır.

AI hakkında daha fazlasını okuyun:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Daha fazla haber
Damir Yalalov
Damir Yalalov

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Hüküm Günü Geliyor: ABD Mahkemesi Adalet Bakanlığı'nın Savunmasını Değerlendirirken CZ'nin Kaderi Dengede

Changpeng Zhao bugün Seattle'daki bir ABD mahkemesinde cezayla karşı karşıya kalmaya hazırlanıyor.

bilmek Daha

Samourai Cüzdan Kurucuları, Darknet Anlaşmalarında 2 Milyar Dolarlık Kolaylık Sağlamakla Suçlanıyor

Samourai Cüzdan kurucularının tutuklanması, sektör için kayda değer bir gerilemeyi temsil ediyor ve ısrarcı tutumun altını çiziyor ...

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
Mitosis, Modüler Likidite Protokolünü Geliştirmek İçin Amber Group ve Foresight Ventures'tan 7 Milyon Dolarlık Finansman Sağladı
İşletme Haber Raporu Teknoloji
Mitosis, Modüler Likidite Protokolünü Geliştirmek İçin Amber Group ve Foresight Ventures'tan 7 Milyon Dolarlık Finansman Sağladı
Mayıs 2, 2024
Galxe, Küresel Erişilebilirliği Genişletmek İçin Jambo ile İşbirliği Yapıyor Web3
İşletme Haber Raporu Teknoloji
Galxe, Küresel Erişilebilirliği Genişletmek İçin Jambo ile İşbirliği Yapıyor Web3
Mayıs 2, 2024
Google'ın Med-Gemini'si Bir Öncülük Yapmaya Hazır GPT-4 Sağlık Alanında Üstün Performansıyla
AI Wiki Haberler Yazılım Teknoloji
Google'ın Med-Gemini'si Bir Öncülük Yapmaya Hazır GPT-4 Sağlık Alanında Üstün Performansıyla
Mayıs 2, 2024
Hong Kong Yasama Konseyi Üyesi Wu Jiezhuang, JPEX Kripto Borsasına Karşı Hukuk Davası Sinyali Verdi
İşletme Haber Raporu Teknoloji
Hong Kong Yasama Konseyi Üyesi Wu Jiezhuang, JPEX Kripto Borsasına Karşı Hukuk Davası Sinyali Verdi
Mayıs 2, 2024
CRYPTOMERIA LABS PTE. LTD.