گزارش خبری پیشرفته
ژانویه 18، 2023

مایکروسافت مدلی منتشر کرده است که می تواند یک آواتار سه بعدی از یک عکس یک شخص بسازد

به طور خلاصه

با استفاده از تکنیک یادگیری ماشینی 2D Diffusion، می‌توان از یک تصویر دو بعدی از چهره یک فرد برای تولید یک آواتار سه بعدی استفاده کرد.

می توان از آن برای ارائه یک نمای سه بعدی واقع گرایانه از شخص برای بازی یا استفاده های دیگر، یا برای ارائه یک تجربه واقعیت مجازی (VR) یا واقعیت افزوده (AR) استفاده کرد.

3D Avatar Diffusion یک الگوریتم یادگیری ماشینی است که می تواند یک تصویر 2 بعدی از صورت انسان بگیرد و یک آواتار سه بعدی (3D) ایجاد کند. سپس می‌توان از آواتار برای ایجاد یک تجربه واقعیت مجازی (VR) یا واقعیت افزوده (AR) استفاده کرد یا به سادگی یک نمای سه‌بعدی واقعی از شخص برای بازی یا اهداف دیگر ارائه داد.

مدل انتشار بود توسعه توسط تیمی از محققان در Microsoft Research و در مقاله منتشر شده در مجله توضیح داده شده است مانند: arXiv.

مایکروسافت مدلی منتشر کرده است که می تواند یک آواتار سه بعدی از یک عکس یک شخص بسازد

انتشار آواتار سه بعدی مبتنی بر یک نوع الگوریتم یادگیری ماشینی به نام مدل انتشار است. مدل‌های انتشار، مدل‌های تولیدی هستند، به این معنی که می‌توانند داده‌های جدیدی تولید کنند که مشابه داده‌های آموزشی است. مدل های انتشار قبلاً برای تولید تصاویر سه بعدی از تصاویر دو بعدی استفاده می شد، اما ADM اولین مدل انتشاری است که می تواند یک آواتار سه بعدی واقعی را از یک تصویر دو بعدی ایجاد کند.

برای آموزش این مدل، محققان از مجموعه داده ای از بیش از 200,000 مدل چهره سه بعدی استفاده کردند. مجموعه داده شامل طیف گسترده ای از چهره ها با رنگ پوست، مدل مو و ویژگی های مختلف صورت بود. سپس ADM توانست رابطه بین تصویر دو بعدی و مدل چهره سه بعدی را بیاموزد و یک آواتار سه بعدی واقعی از یک تصویر دو بعدی ایجاد کند.

همچنین می توان از این مدل برای تولید آواتار از عکسی که از زاویه دیگری گرفته شده است استفاده کرد

برای آواتار 3 بعدی شخصی، مدل Rodin دستکاری متنی را ارائه می دهد. ویرایش زبان طبیعی روشی بصری برای تغییر بسیاری از ویژگی‌های آواتار سه بعدی مختلف است.

این مطالعه یک مدل مولد سه‌بعدی را پیشنهاد می‌کند که به طور خودکار آواتارهای دیجیتالی سه‌بعدی را ایجاد می‌کند که به‌عنوان میدان‌های درخشندگی عصبی با استفاده از مدل‌های انتشار نشان داده می‌شوند. به دلیل محدودیت حافظه و الزامات پردازش مرتبط با سه بعدی، ایجاد ویژگی های غنی لازم برای آواتارهای با کیفیت بالا یک مسئله بزرگ است. توسعه‌دهندگان پیشنهاد می‌کنند که شبکه‌ی انتشاری (Rodin) به این مشکل رسیدگی کند.

از نظر جنسیت، سن، نژاد، حالت ظاهری، لوازم جانبی صورت و غیره، این مدل تنوع نسلی برجسته ای را نشان می دهد.را

این شبکه نقشه‌های ویژگی دوبعدی متعددی از یک میدان تابش عصبی را در یک صفحه مشخصه دو بعدی ارائه می‌کند، جایی که مدل سپس انتشار سه بعدی آگاه را اجرا می‌کند. مدل رودین از پیچیدگی 2D-aware استفاده می کند، که به ویژگی های پیش بینی شده در صفحه ویژگی دوبعدی مطابق با رابطه اصلی آنها در سه بعدی توجه می کند تا بازده محاسباتی بسیار مورد نیاز را در عین حفظ یکپارچگی انتشار در 2 بعدی ارائه دهد.

درباره هوش مصنوعی بیشتر بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

در میان نوسانات، اشتهای سازمانی به سمت ETF های بیت کوین رشد می کند

افشاگری از طریق پرونده های 13F نشان می دهد که سرمایه گذاران نهادی قابل توجهی در ETF های بیت کوین مشغول هستند و بر پذیرش فزاینده ...

بیشتر بدانید

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
Nexo "شکار" را آغاز می کند تا به کاربران با 12 میلیون دلار توکن NEXO برای تعامل با اکوسیستم خود پاداش دهد.
بازارها گزارش خبری پیشرفته
Nexo "شکار" را آغاز می کند تا به کاربران با 12 میلیون دلار توکن NEXO برای تعامل با اکوسیستم خود پاداش دهد.
ممکن است 8، 2024
صرافی Revolut X Revolut، معامله‌گران رمزارز را با هزینه‌های سازنده صفر و تجزیه‌وتحلیل پیشرفته وام می‌کند.
بازارها نرم افزار داستان ها و نقدها پیشرفته
صرافی Revolut X Revolut، معامله‌گران رمزارز را با هزینه‌های سازنده صفر و تجزیه‌وتحلیل پیشرفته وام می‌کند.
ممکن است 8، 2024
پلتفرم تجارت کریپتو BitMEX گزینه های معامله را با 0 کارمزد و مشوق های نقدی آغاز می کند
کسب و کار بازارها گزارش خبری
پلتفرم تجارت کریپتو BitMEX گزینه های معامله را با 0 کارمزد و مشوق های نقدی آغاز می کند
ممکن است 8، 2024
Lisk رسما به لایه 2 اتریوم منتقل می شود و Core نسخه 4.0.6 را معرفی می کند
گزارش خبری پیشرفته
Lisk رسما به لایه 2 اتریوم منتقل می شود و Core نسخه 4.0.6 را معرفی می کند
ممکن است 8، 2024
CRYPTOMERIA LABS PTE. محدود