Корпорація Майкрософт випустила дифузійну модель, яка може створити 3D-аватар з однієї фотографії людини
Коротко
Одне 2D-зображення обличчя людини можна використовувати для створення 3D-аватара за допомогою техніки машинного навчання 3D Avatar Diffusion.
Його можна використовувати для надання реалістичного 3D-виду людини для ігор чи інших цілей, або для надання досвіду віртуальної реальності (VR) або доповненої реальності (AR).
3D Avatar Diffusion — це алгоритм машинного навчання, який може взяти одне двовимірне зображення людського обличчя та створити тривимірний (2D) аватар. Потім аватар можна використовувати для створення досвіду віртуальної реальності (VR) або доповненої реальності (AR) або просто для надання реалістичного тривимірного вигляду людини для ігор чи інших цілей.
Модель дифузії була розвиненою групою дослідників Microsoft Research і описано в статті, опублікованій в журналі ArXiv.
3D Avatar Diffusion базується на типі алгоритму машинного навчання, який називається моделлю дифузії. Дифузійні моделі є генеративними моделями, що означає, що вони можуть генерувати нові дані, подібні до навчальних даних. Дифузійні моделі раніше використовувалися для створення 3D-зображень із 2D-зображень, але ADM є першою дифузійною моделлю, яка може створити реалістичний 3D-аватар з одного 2D-зображення.
Щоб навчити модель, дослідники використали набір даних із понад 200,000 3 2D-моделей обличчя. Набір даних включав широкий спектр облич з різними відтінками шкіри, зачісками та рисами обличчя. Тоді ADM зміг дізнатися про зв’язок між 3D-зображенням і 3D-моделлю обличчя та створити реалістичний 2D-аватар з одного XNUMXD-зображення.
Модель також можна використовувати для створення аватара з фотографії, зробленої під іншим кутом
У цьому дослідженні пропонується тривимірна генеративна модель, яка автоматично створює тривимірні цифрові аватари, які представлені у вигляді нейронних полів випромінювання за допомогою дифузійних моделей. Через непомірні вимоги до пам’яті та обробки, пов’язані з 3D, створення багатих функцій, необхідних для високоякісних аватарів, є величезною проблемою. Розробники пропонують розгорнуту дифузійну мережу (Rodin) вирішити цю проблему.
Ця мережа розгортає численні 2D-карти функцій поля нейронного випромінювання в одну площину 2D-функцій, де потім модель виконує дифузію з урахуванням 3D. Модель Родена використовує згортку з урахуванням 3D, яка звертає увагу на спроектовані об’єкти в площині 2D-об’єктів відповідно до їх вихідного співвідношення в 3D, щоб забезпечити таку необхідну обчислювальну ефективність, зберігаючи при цьому цілісність дифузії в 3D.
Докладніше про ШІ:
відмова
Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.
про автора
Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється.
інші статтіДамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється.