Lambda Labs 宣布了一种 AI 图像混合器,最多可以组合五张图像
简单来说
AI混音器建立在 Stable Diffusion 图片 变体模型,经过优化可以接受大量 CLIP 图像嵌入。
人工智能研究实验室 Lambda Labs 宣布了一项新的 人工智能图像混合器 最多可以组合五张图像。 图像混合器基于 Stable Diffusion 图像变化模型,经过微调可以采用多个 CLIP 图像嵌入。 该工具称为“图像混合器”,旨在帮助用户通过混合和匹配现有图像来创建新图像。
与市场上的其他图像混合软件相比,这种新的图像混合器允许更大程度的控制和定制。 通过设置每个单独图像的强度,用户可以根据他们的特定需求创建独特而有趣的混合。 该混音器还能够以比大多数其他软件更高的分辨率输出图像,使其成为专业设置的理想选择。
Lambda Labs 表示图像混合器可用于创建“新颖”图像或简单地创建现有图像的新版本。 图像可以由用户上传或从 URL 检索。
在训练过程中,最多从训练图像中随机裁剪 XNUMX 个,并计算 CLIP 图像嵌入。 然后将它们连接起来并用作模型的条件。 在推理时,可以组合来自多个图像的图像嵌入来混合它们的概念。 文本编码器也可用于添加文本概念。
该模型以 640×640 的分辨率在 LAION Improved Aesthetics 的子集上进行训练,并在 Lambda GPU Cloud 上使用 8xA100 GPU 进行训练。
虽然 图像混合器 虽然仍处于早期阶段,但它在平面设计、广告甚至医学等各个领域都有巨大的应用潜力。 凭借其创建逼真且复杂的图像混合的能力,可能性几乎是无限的。
阅读有关人工智能的更多信息:
免责声明
在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。
关于作者
Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。
更多文章Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。