为此,DeepMind团队一直在开发越来越复杂的几何解决方案。其第一个版本于去年一月发布,名为AlphaGeometry;第二个版本称为AlphaGeometry2。
DeepMind团队将其与他们开发的另一个系统Alpha Proof结合使用,该系统进行数学证明。团队发现它能够解决今年夏天IMO列出的6个问题中的4个。对于这项新研究,研究团队通过提供过去25年IMO使用的多个问题来扩展系统能力的测试。
研究团队通过结合多个核心元素构建了AlphaGeometry2,其中之一是谷歌的Gemini语言模型。其他元素使用数学规则来提出原始问题或其部分的解决方案。
团队指出,为了解决许多IMO问题,必须在继续之前添加某些构造,这意味着他们的系统必须能够创建它们。然后,他们的系统尝试预测哪些已添加到图中的构造应被用于进行解决问题所需的推理。AlphaGeometry2建议可能用于解决给定问题的步骤,然后在使用之前检查这些步骤的逻辑性。
为了测试他们的系统,研究人员从IMO中选择了45个问题,其中一些需要翻译成更可用的形式,最终总共形成50个问题。他们报告称,AlphaGeometry2能够正确解决其中的42个,略高于比赛中人类金牌得主的平均水平。