新闻报道 专业技术
2023 年 1 月 24 日

VToonify:用于生成艺术人像视频的实时 AI 模型

简单来说

开发人员开发了一个革命性的 VToonify 框架,以提供受控的高分辨率肖像视频风格转换。

为了制作令人惊叹的艺术肖像,该框架使用了 StyleGAN 的中高分辨率层。

它允许扩展现有的基于 StyleGAN 的 图像卡通化模型 到视频。

南洋理工大学的研究人员已经 引入了一个新颖的 VToonify 框架 生成可控的高分辨率人像视频风格迁移。 VToonify 利用 StyleGAN 的中高分辨率层,根据编码器提取的多尺度内容特征来渲染高质量的艺术肖像,以更好地保留帧细节。 实验结果表明,我们的框架可以生成具有始终如一的高质量和所需面部表情的视频,而无需面部对齐或帧大小限制。

因此,接受各种尺寸视频中未对齐面孔的全卷积架构会生成具有有机运动的完整面孔。 VToonify 框架继承了这些模型的吸引人的特性,可以对颜色和强度进行灵活的样式控制。 它与现有的基于 StyleGAN 的图像卡通化模型兼容,可将其扩展到视频卡通化。 这项工作介绍了 VToonify 的两个实例,分别基于 Toonify 和 DualStyleGAN,用于基于集合和基于样本的肖像视频风格转换。

Vtoonify:用于生成艺术人像视频的实时 AI 模型

广泛的实验结果表明,所提出的 VToonify 框架在制作具有可调节风格控制的艺术肖像电影方面优于竞争方法,这些电影具有出色的质量和时间上的一致性。 查看 GitHub上 以获得更多细节。

相关文章: OpenAI 正在致力于创建视频人工智能模型

为了提供可控的高分辨率人像视频风格转换,VToonify 结合了图像翻译框架和基于 StyleGAN 的框架的优点。

(A) 为了支持可变输入大小,图像翻译系统使用全卷积网络。 然而,在从头开始教学时,传授高分辨率和受控风格是一项挑战。

(B) 基于 StyleGAN 的框架,仅支持固定图片尺寸和细节损失,使用预训练的 StyleGAN 模型进行高分辨率和可控的风格迁移。

(C) 为了创建一个类似于图像翻译框架的完全卷积编码器-生成器架构,我们的混合系统通过删除其固定大小的输入特征和低分辨率层来扩展 StyleGAN。

为了保留帧细节,开发人员训练编码器从输入帧中提取多尺度内容特征作为附加内容条件。 VToonify 继承了 StyleGAN 模型的样式控制灵活性,将其放入生成器中以提取其数据和模型。

Vtoonify:用于生成艺术人像视频的实时 AI 模型
相关文章: Lambda Labs 宣布了一种 AI 图像混合器,最多可以组合五张图像

VToonify 框架继承了当前基于 StyleGAN 的图像 Toonification 模型灵活风格控制的吸引人的特性,并与之兼容,将其扩展为 电影 卡通化。 我们的 VToonify 使用 DualStyleGAN 模型作为 StyleGAN 基础提供以下功能:

  • 从基于范例的结构转移风格;
  • 风格度修饰;
  • 基于范例的颜色风格迁移。
Vtoonify:用于生成艺术人像视频的实时 AI 模型
对于 StyleGAN 蒸馏,开发人员比较了两个主干 Toonify 和 DualStyleGAN,以及高分辨率图像到图像转换基线 Pix2pixHD。 VToonify-T 和 VToonify-D 在对整个视频进行风格化同时保持与每个单独帧的主干相同的高质量和视觉元素方面优于其同类主干 Toonify 和 DualStyleGAN。 例如,VToonify-T 遵循 Toonify 以施加强烈的风格效果,例如奥术风格中的紫罗兰色头发。 另一方面,VToonify-D 在保持面部特征方面做得更好。 与 VToonify-D 相比,Pix2pixHD 存在闪烁和伪像。

阅读有关人工智能的更多信息:

免责声明

在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。

关于作者

Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。 

更多文章
达米尔亚拉洛夫
达米尔亚拉洛夫

Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。 

Hot Stories

AltLayer 进入质押计划第二阶段,推出 reALT 代币

by 艾丽莎·戴维森
2024 年 5 月 02 日

Aave Labs 公布“Aave 2030”提案,包括启动 Aave V4 协议

by 艾丽莎·戴维森
2024 年 5 月 02 日
加入我们的时事通讯。
最新消息

AltLayer 进入质押计划第二阶段,推出 reALT 代币

by 艾丽莎·戴维森
2024 年 5 月 02 日

Aave Labs 公布“Aave 2030”提案,包括启动 Aave V4 协议

by 艾丽莎·戴维森
2024 年 5 月 02 日

宣判日到来:美国法院考虑司法部的认罪,CZ 的命运悬而未决

赵长鹏将于今天在西雅图的美国法院接受宣判。

了解更多

Samourai Wallet 创始人被指控在暗网交易中协助 2 亿美元

Samourai 钱包创始人的被捕对整个行业来说是一个显着的挫折,凸显了持续的......

了解更多
加入我们的创新技术社区
了解更多
查看更多
AltLayer 进入质押计划第二阶段,推出 reALT 代币
市场 新闻报道 专业技术
AltLayer 进入质押计划第二阶段,推出 reALT 代币
2024 年 5 月 2 日
BNB Chain发布1年第一季度报告,价值损失减少2024%,BSC TVL飙升55.8%
市场 新闻报道 专业技术
BNB Chain发布1年第一季度报告,价值损失减少2024%,BSC TVL飙升55.8%
2024 年 5 月 2 日
Naver 和 Kakao 的 Kaia:新的亚洲区块链巨头准备颠覆全球加密货币市场
企业 软件 故事和评论 专业技术
Naver 和 Kakao 的 Kaia:新的亚洲区块链巨头准备颠覆全球加密货币市场
2024 年 5 月 2 日
Aave Labs 公布“Aave 2030”提案,包括启动 Aave V4 协议
企业 新闻报道 专业技术
Aave Labs 公布“Aave 2030”提案,包括启动 Aave V4 协议
2024 年 5 月 2 日