谷歌DeepMind公布了一个人工智能系统,该系统在今年国际数学奥林匹克竞赛(IMO)中达到了银牌级别的表现。这个混合系统结合了名为AlphaProof和AlphaGeometry 2的两个专业模型,在这项著名的竞赛中解决了六个问题中的四个,标志着人工智能在数学推理能力方面取得了新的里程碑。
国际数学奥林匹克竞赛被广泛认为是世界上最具挑战性的针对大学生的数学竞赛,已成为评估人工智能高级解决问题能力的一个基准。谷歌DeepMind的系统在42个可能获得的积分中获得了28分,仅差1分即可达到今年609名参赛者中仅有58人获得的29分金牌门槛。
这一成就的核心是AlphaProof,这是一种新型的人工智能,它将预训练的语言模型与AlphaZero强化学习算法相结合——这是掌握国际象棋和围棋等复杂游戏所用的相同技术。这种集成使得AlphaProof能够以类似游戏的策略来进行数学推理,就像在庞大的决策树中搜索可能的证明步骤一样。与以往受稀缺人类编写数据限制的方法不同,AlphaProof弥补了自然语言和形式语言之间的差距。它使用谷歌Gemini模型的微调版本来将自然语言问题翻译成形式化陈述,从而创建了一个庞大的训练材料库。
作为AlphaProof的补充,AlphaGeometry 2是DeepMind几何求解器的升级版。该系统表现出惊人的效率,仅用19秒就解决了一个国际数学奥林匹克竞赛(IMO)问题。其性能提升得益于训练数据的增强以及一种新颖的知识共享机制,该机制使问题求解更为复杂。在今年竞赛之前,AlphaGeometry 2能够解决过去25年来所有历史IMO几何问题的83%,相比前代产品53%的成功率有了显著提高。
这些问题被手动翻译成正式的数学语言,以便AI系统理解。虽然官方竞赛允许学生分两次进行,每次4.5小时,但AI系统在几分钟内就解决了一个问题,而解决其他问题则耗时长达三天。
Google DeepMind 在国际数学奥林匹克竞赛(IMO)上的成功凸显了AI在解决高级推理任务方面取得的快速进展。随着这些系统的不断发展,它们有潜力加速科学发现并推动人类知识的边界。
Google DeepMind 计划很快发布更多关于 AlphaProof 的技术细节,并继续探索多种AI方法以推动数学推理的进步。