Gen-1:AI 通过结合提示和图像从现有视频生成新视频
简单来说
人工智能初创公司 RunWayML, 已公布 一种名为 Gen-1 的新产品,一种神经网络,可以通过结合提示和图像从现有视频中生成新视频。 多年来,神经网络一直局限于风格转换的任务,即拍摄一张图像并将另一张图像的风格应用到它的过程。 这就是我们如何获得那些迷幻的深度学习风格迁移视频,例如,以梵高的星夜风格渲染风景。
现在,有了 Gen-1,神经网络可以做的不仅仅是风格转换。 它可以使用提示和图像作为输入从头开始生成新视频。 这开辟了全新的可能性范围 人工智能创建的视频. 目前,Gen-1 生成的视频短小精悍。 但随着技术的发展,我们可以期待看到更复杂和 人工智能生成的逼真视频.
推荐帖子: 通过在虚拟现实中观看成人视频改善男性的生殖健康 |
什么是 Gen-1?
文字引导解锁强大的图片创作和编辑工具 生成扩散模型. 虽然这些已应用于视频的创建,但目前用于编辑现有材料的内容同时保持其结构的方法需要对每个输入进行昂贵的再培训,或者依赖于帧之间图片更改的风险传播。
开发人员描述了一种以结构和内容为导向的视频传播模型,该模型根据对所需结果的书面或视觉描述来改变电影。 由于解耦不充分,用户提供的内容修改和结构表示之间会出现冲突。 他们证明,结构和内容的完整性可以通过对具有不同细节层次的单眼深度估计进行训练来控制。
通过将图像或文本提示的构图和风格应用于源视频的结构,以逼真且一致的方式合成新视频。 这就像在没有实际拍摄任何东西的情况下拍摄新事物。
将图像或提示的风格转移到视频的每一帧是统一项目、赋予其总体视觉主题并保持一致性的好方法。
通过使用软件和创意设计,可以将模型转化为美观的交互式渲染图,将用户的愿景变为现实。
借助视频编辑功能,可以轻松分离视频的各个部分并使用文本提示对其进行增强。
应用输入图像或 提示 无纹理渲染可以极大地提高其真实感,使 3D 模型栩栩如生。
Runway Research 致力于构建多模态 AI 系统,以实现新形式的创造力。 Gen-1 代表了我们在这一使命中向前迈出的又一关键步骤。 如果您是一名创意人士,希望尝试讲故事的未来,请在下方申请访问权限。
Gen-1 还可用于从头开始创建全新的视频。 它可以用于多种目的,包括创建现有电影的新版本或完全创建新电影。 这个消息肯定会让电影制作人和其他一直在寻找新方法来突破其艺术界限的创意人士兴奋不已。 有了 Gen-1,他们现在拥有了一个新的强大工具供他们使用。
的能力 生成新视频 来自现有的有许多潜在的应用。 例如,它可用于创建现有视频内容的新版本,因此它可用于创建可能过于昂贵或逻辑上难以拍摄的场景或镜头的替代版本。
您可以在 Beta 测试期间申请使用该模型 点击此处.
阅读有关人工智能的更多信息:
免责声明
在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。
关于作者
Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。
更多文章Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。