谷歌DeepMind发布SIMA 2:能够在3D虚拟世界中玩耍、推理和学习的人工智能代理
简单来说
Google DeepMind 推出了 SIMA 2 AI 代理,它可以在虚拟环境中理解指令、推理并自学新技能,接近人类水平的任务完成能力。
谷歌科技公司的人工智能部门, 谷歌深度思维 推出了 SIMA 2,这是其可扩展指令多世界代理的最新版本,标志着向功能更强大、用途更广泛的 AI 代理迈进。
该系统基于 Gemini 模型的先进推理能力,其功能不再局限于在虚拟环境中遵循基本指令,而是可以作为交互式助手,能够解释目标、与用户对话,并随着时间的推移不断改进其性能。
第一个 SIMA 模型通过观察屏幕输入并使用虚拟控件而不是集成的游戏机制,学习了商业视频游戏中数百种语言驱动的动作。
SIMA 2 通过将 Gemini 作为核心嵌入其中,进一步推进了这一方法,使智能体能够进行目标导向推理、解释其预期行为,并在游戏中执行更复杂的任务。该智能体基于人类演示和 Gemini 生成的标注进行训练,并通过与多家游戏开发商的合作,在更广泛的游戏中进行了测试。此次更新标志着具身人工智能发展迈出了重要一步,它将感知、推理和行动融合在动态 3D 环境中。
Gemini 的集成增强了 SIMA 2 在陌生环境中泛化和可靠运行的能力。现在,该智能体能够理解更详细、更细致的指令,并成功执行,即使是在它以前从未接触过的游戏中,例如以维京为主题的 ASKA 或 MineDojo(Minecraft 的研究版本)。
它能够将学习到的概念应用到不同的环境中——例如,将“挖掘”的概念从一个游戏中扩展到另一个游戏中的“收获”——这是广泛概括的关键组成部分,并使其表现更接近人类玩家。
为了评估这些能力,SIMA 2 还在 Genie 3 创建的程序化 3D 世界中进行了测试。Genie 3 可以根据文本或图像提示生成新的环境。在这些陌生的环境中,智能体仍然能够有效地导航、理解指令并朝着用户期望的方向努力。defi目标明确,展现出类似系统中前所未见的适应能力。
SIMA 2 凭借泛化和自主学习方面的新功能,推进了自我改进人工智能的发展
据 公司SIMA 2 最显著的进步之一是其不断提升自身性能的能力。在训练过程中,该智能体通过反复试错并结合 Gemini 的反馈,展现出能够胜任日益复杂的任务。在最初通过人类演示学习之后,SIMA 2 能够通过自主游戏在新游戏中不断进步,在陌生的环境中积累技能,而无需额外的人类数据。这些经验随后可用于训练后续更强大的版本。 人工智能代理同样的自我改进过程已成功应用于 Genie 生成的环境中,这标志着在训练通用智能体以适应各种合成世界方面取得了意义重大的进展。这种持续改进的循环有助于实现更长远的目标,即让智能体能够在极少的人工指导下进行学习。
SIMA 2 在各种游戏环境中的运行为其通用智能提供了一个重要的测试平台,使其能够通过自主行动来获取技能、练习推理并持续学习。尽管该系统代表着向通用型、交互式、具身智能迈出的重要一步,但它仍然存在明显的研发阶段局限性。智能体在处理需要长时间推理或反复目标验证的复杂、长周期任务时仍然面临挑战,并且由于需要在有限的上下文窗口内进行低延迟交互,其记忆容量仍然有限。精细动作的精确性和对复杂 3D 场景的视觉理解仍然是该领域普遍存在的挑战。
该项目展示了一种面向行动的人工智能方法的潜力,该方法通过多样化的训练数据和强大的推理能力来支持广泛的能力。SIMA 2 表明,这些要素可以整合到一个通用智能体中,而不是孤立地存在于不同的专业系统中。它为未来在机器人领域的应用提供了一条充满希望的道路,因为在虚拟环境中学习到的许多技能——例如导航、工具使用和协作任务处理——都可以转化为具身人工智能的基本组成部分。
SIMA 2 被设计成一个以人为本的交互式研究代理,其开发过程明确侧重于负责任的实践,尤其是在自我改进机制方面。团队在整个项目过程中与负责任创新专家密切合作,并以有限的研究预览版形式发布 SIMA 2,为部分学者和游戏开发者提供早期访问权限。这种分阶段的方法能够确保在进一步探索该技术及其潜在影响的过程中,持续进行审查、反馈和跨学科评估。
免责声明
在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。
关于作者
Alisa,一名热心记者 MPost,专注于加密货币、零知识证明、投资以及广泛的领域 Web3。她对新兴趋势和技术有着敏锐的洞察力,提供全面的报道,让读者了解和吸引读者了解不断发展的数字金融领域。
更多文章
Alisa,一名热心记者 MPost,专注于加密货币、零知识证明、投资以及广泛的领域 Web3。她对新兴趋势和技术有着敏锐的洞察力,提供全面的报道,让读者了解和吸引读者了解不断发展的数字金融领域。