微软发布了一个扩散模型,可以从一个人的单张照片中构建一个 3D 头像
简单来说
人脸的单个 2D 图像可用于使用 3D Avatar Diffusion 机器学习技术生成 3D 头像。
它可用于为游戏或其他用途提供人的逼真 3D 视图,或提供虚拟现实 (VR) 或增强现实 (AR) 体验。
3D Avatar Diffusion 是一种机器学习算法,可以拍摄一张人脸的 2D 图像并创建三维 (3D) 头像。 然后,化身可用于创建虚拟现实 (VR) 或增强现实 (AR) 体验,或简单地提供人物的逼真 3D 视图,用于游戏或其他目的。
扩散模型是 发达 由 Microsoft Research 的一组研究人员在期刊上发表的一篇论文中进行了描述 arXiv.
3D Avatar Diffusion 基于一种称为扩散模型的机器学习算法。 扩散模型是生成模型,这意味着它们可以生成与训练数据相似的新数据。 扩散模型 之前已被用于从 3D 图像生成 2D 图像,但 ADM 是第一个可以从单个 3D 图像生成逼真的 2D 头像的扩散模型。
为了训练模型,研究人员使用了超过 200,000 个 3D 面部模型的数据集。 该数据集包括具有不同肤色、发型和面部特征的各种面孔。 然后,ADM 能够学习 2D 图像和 3D 面部模型之间的关系,并从单个 3D 图像生成逼真的 2D 头像。
该模型还可用于根据从不同角度拍摄的照片生成头像
本研究提出了一种 3D 生成模型,可自动创建 3D 数字化身,这些化身使用扩散模型表示为神经辐射场。 由于与 3D 相关的内存和处理要求过高,创建高质量化身所需的丰富功能是一个巨大的问题。 开发人员建议推出扩散网络 (Rodin) 解决此问题。
该网络将神经辐射场的大量 2D 特征映射展开到单个 2D 特征平面中,然后模型在其中执行 3D 感知扩散。 Rodin 模型使用 3D 感知卷积,它根据 2D 中的原始关系处理 3D 特征平面中的投影特征,以提供急需的计算效率,同时保持 3D 扩散的完整性。
阅读有关人工智能的更多信息:
免责声明
在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。
关于作者
Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。
更多文章Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。