DeepMind AI在奥林匹克数学竞赛中达到金牌水平

2025年02月11日 由 佚名 发表 35 0
谷歌DeepMind项目的研究团队报告称,其AlphaGeometry2 AI在解决过去25年国际数学奥林匹克竞赛(IMO)中高中生题目时,表现达到了金牌水平。在他们的论文发布在arXiv预印本服务器上,团队详细介绍了AlphaGeometry2及其在解决IMO问题时的得分情况。


DeepMind group claims its AlphaGeometry2 AI app performed at gold-medal level at Olympiad
搜索算法概述。来源:arXiv(2025)。DOI: 10.48550/arxiv.2502.03544


先前的研究表明,能够解决几何问题的AI可能会导致更复杂的应用程序,因为它们需要高水平的推理能力以及从可能的步骤中选择以解决问题的能力。

为此,DeepMind团队一直在开发越来越复杂的几何解决方案。其第一个版本于去年一月发布,名为AlphaGeometry;第二个版本称为AlphaGeometry2。

DeepMind团队将其与他们开发的另一个系统Alpha Proof结合使用,该系统进行数学证明。团队发现它能够解决今年夏天IMO列出的6个问题中的4个。对于这项新研究,研究团队通过提供过去25年IMO使用的多个问题来扩展系统能力的测试。

研究团队通过结合多个核心元素构建了AlphaGeometry2,其中之一是谷歌的Gemini语言模型。其他元素使用数学规则来提出原始问题或其部分的解决方案。

团队指出,为了解决许多IMO问题,必须在继续之前添加某些构造,这意味着他们的系统必须能够创建它们。然后,他们的系统尝试预测哪些已添加到图中的构造应被用于进行解决问题所需的推理。AlphaGeometry2建议可能用于解决给定问题的步骤,然后在使用之前检查这些步骤的逻辑性。

为了测试他们的系统,研究人员从IMO中选择了45个问题,其中一些需要翻译成更可用的形式,最终总共形成50个问题。他们报告称,AlphaGeometry2能够正确解决其中的42个,略高于比赛中人类金牌得主的平均水平。

文章来源:https://techxplore.com/news/2025-02-deepmind-ai-gold-medal-olympiad.html
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消