谷歌基于 Deep Think 的高级 Gemini 模型在国际数学奥林匹克竞赛中凭借人类水平的解题能力夺得金牌
简单来说
谷歌 DeepMind 的 Gemini AI 模型的高级版本在国际数学奥林匹克竞赛中取得了金牌级别的成绩,解决了六个问题中的五个,标志着人工智能在人类水平的数学推理方面取得了重要的里程碑。
谷歌的人工智能部门, 谷歌深度思维 宣布其Gemini Deep Think模型的高级版本在国际数学奥林匹克(IMO)的六道题目中成功解答了五道,获得35分,相当于金牌水平。这是IMO协调员首次使用与人类参赛者相同的标准对模型结果进行正式评估和认证。
本次演示中使用的 Gemini Deep Think 系统 featured 增强的推理能力,专为解决复杂的数学问题而设计。它融合了最新的研究成果,包括一种被称为“并行思维”的方法,该方法允许模型在得出最终答案之前同时探索和整合多种解决方案路径,而不是遵循单一的线性过程。
为了提升模型性能,研究人员采用了强化学习技术进行训练,旨在增强多步推理、定理证明和一般问题解决能力。此外,该系统还获得了一套精选的高质量数学解决方案,以及解答 IMO 题型的指导。
在向 Google AI Ultra 订阅用户广泛发布之前,该 Deep Think 模型的有限版本将与包括数学家在内的选定测试人员共享。
这一进展比去年的成就迈出了重要一步。2024 年,像 AlphaGeometry 和 AlphaProof 这样的模型需要人工干预才能将问题翻译成特定领域的语言(例如 Lean),然后再翻译回来。此外,解决问题需要几天的计算时间。相比之下,更新后的 双子座模型 直接从官方 IMO 问题陈述中生成数学上严格的解决方案,完全使用自然语言,并在标准的 4.5 小时比赛时间范围内。
IMO成为人工智能高级数学推理的关键基准
国际数学奥林匹克(IMO)是一项历史悠久的全球性竞赛,汇集了大学预科阶段的优秀学生,共同攻克六道涵盖代数、组合学、几何学和数论等主题的高等数学难题。IMO创办于1959年,被广泛认为是全球最具挑战性的数学竞赛之一。每个参赛国派出一支由六名学生组成的队伍,排名前50%的选手将获得奖牌,其中约8%的选手将获得金牌。
近年来,这项竞赛也已成为评估人工智能在复杂问题解决和数学推理能力方面的基准。2024年,谷歌DeepMind的AlphaProof和AlphaGeometry 2组合系统取得了银牌级成绩,解决了六个问题中的四个,获得28分。这一基于形式数学语言的成果,标志着人工智能在展现其匹敌人类高级数学技能的潜力方面迈出了显著的一步。
免责声明
在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。
关于作者
Alisa,一名热心记者 MPost,专注于加密货币、零知识证明、投资以及广泛的领域 Web3。她对新兴趋势和技术有着敏锐的洞察力,提供全面的报道,让读者了解和吸引读者了解不断发展的数字金融领域。
更多文章
Alisa,一名热心记者 MPost,专注于加密货币、零知识证明、投资以及广泛的领域 Web3。她对新兴趋势和技术有着敏锐的洞察力,提供全面的报道,让读者了解和吸引读者了解不断发展的数字金融领域。