مایکروسافت مدلی منتشر کرده است که می تواند یک آواتار سه بعدی از یک عکس یک شخص بسازد
به طور خلاصه
با استفاده از تکنیک یادگیری ماشینی 2D Diffusion، میتوان از یک تصویر دو بعدی از چهره یک فرد برای تولید یک آواتار سه بعدی استفاده کرد.
می توان از آن برای ارائه یک نمای سه بعدی واقع گرایانه از شخص برای بازی یا استفاده های دیگر، یا برای ارائه یک تجربه واقعیت مجازی (VR) یا واقعیت افزوده (AR) استفاده کرد.
3D Avatar Diffusion یک الگوریتم یادگیری ماشینی است که می تواند یک تصویر 2 بعدی از صورت انسان بگیرد و یک آواتار سه بعدی (3D) ایجاد کند. سپس میتوان از آواتار برای ایجاد یک تجربه واقعیت مجازی (VR) یا واقعیت افزوده (AR) استفاده کرد یا به سادگی یک نمای سهبعدی واقعی از شخص برای بازی یا اهداف دیگر ارائه داد.
مدل انتشار بود توسعه توسط تیمی از محققان در Microsoft Research و در مقاله منتشر شده در مجله توضیح داده شده است مانند: arXiv.
انتشار آواتار سه بعدی مبتنی بر یک نوع الگوریتم یادگیری ماشینی به نام مدل انتشار است. مدلهای انتشار، مدلهای تولیدی هستند، به این معنی که میتوانند دادههای جدیدی تولید کنند که مشابه دادههای آموزشی است. مدل های انتشار قبلاً برای تولید تصاویر سه بعدی از تصاویر دو بعدی استفاده می شد، اما ADM اولین مدل انتشاری است که می تواند یک آواتار سه بعدی واقعی را از یک تصویر دو بعدی ایجاد کند.
برای آموزش این مدل، محققان از مجموعه داده ای از بیش از 200,000 مدل چهره سه بعدی استفاده کردند. مجموعه داده شامل طیف گسترده ای از چهره ها با رنگ پوست، مدل مو و ویژگی های مختلف صورت بود. سپس ADM توانست رابطه بین تصویر دو بعدی و مدل چهره سه بعدی را بیاموزد و یک آواتار سه بعدی واقعی از یک تصویر دو بعدی ایجاد کند.
همچنین می توان از این مدل برای تولید آواتار از عکسی که از زاویه دیگری گرفته شده است استفاده کرد
این مطالعه یک مدل مولد سهبعدی را پیشنهاد میکند که به طور خودکار آواتارهای دیجیتالی سهبعدی را ایجاد میکند که بهعنوان میدانهای درخشندگی عصبی با استفاده از مدلهای انتشار نشان داده میشوند. به دلیل محدودیت حافظه و الزامات پردازش مرتبط با سه بعدی، ایجاد ویژگی های غنی لازم برای آواتارهای با کیفیت بالا یک مسئله بزرگ است. توسعهدهندگان پیشنهاد میکنند که شبکهی انتشاری (Rodin) به این مشکل رسیدگی کند.
این شبکه نقشههای ویژگی دوبعدی متعددی از یک میدان تابش عصبی را در یک صفحه مشخصه دو بعدی ارائه میکند، جایی که مدل سپس انتشار سه بعدی آگاه را اجرا میکند. مدل رودین از پیچیدگی 2D-aware استفاده می کند، که به ویژگی های پیش بینی شده در صفحه ویژگی دوبعدی مطابق با رابطه اصلی آنها در سه بعدی توجه می کند تا بازده محاسباتی بسیار مورد نیاز را در عین حفظ یکپارچگی انتشار در 2 بعدی ارائه دهد.
درباره هوش مصنوعی بیشتر بخوانید:
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.
مقالات بیشترDamir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.