DeepMind最新AI系统AlphaGeometry可解决几何难题

2024年01月18日 由 daydream 发表 392 0

Google DeepMind 和纽约大学计算机科学系的研究人员推出了 AlphaGeometry —— 一种能够解决大学水平几何问题的人工智能系统,其技能水平接近世界上最聪明的高中数学天才。正如在《自然》杂志上发表的论文所描述的,AlphaGeometry 在一项由 30 个具有挑战性的经典几何问题组成的基准测试中,展现出了与国际数学奥林匹克(IMO)金牌得主相媲美的专业水平。


微信截图_20240118100943


这项工作代表了人工智能在数学和推理领域前沿的重大进步。AlphaGeometry 在官方奥林匹克的时间限制下,正确地解决了 30 个问题中的 25 个。相比之下,之前的最先进的几何求解器只能成功地解决 10 个问题,而平均的人类金牌得主解决了 25.9 个问题。


微信截图_20240118104224


与那些为数学竞赛而进行密集训练的天才青少年一对一竞争,可能看起来是一个定义狭窄的挑战。然而,几何学需要在构建有效的证明和掌握空间关系方面具有创造力和直觉,这些能力是高级推理的核心。


到目前为止,人工智能在数学领域的旅程一直是坎坷的 —— 尤其是在几何学这样的领域。与数学的其他领域不同,几何学依赖于视觉-空间推理,而且其独特的翻译挑战造成了数据瓶颈。现有的机器学习方法在这里经常失败,受到人类证明翻译成机器可验证语言的稀缺性的限制。


微信截图_20240118104230


那么,DeepMind 的系统是如何实现奥林匹克级的技能的呢?AlphaGeometry 利用了神经语言模型和基于规则的演绎引擎两种方法。神经语言模型能够直观地提出有用的探索途径,而基于规则的演绎引擎能够严格地检查欧几里得几何领域的逻辑证明步骤。神经组件将创造力集中在有希望的解决方案上,而符号逻辑则提供数学上的正确验证 —— 一种灵活的配对。


如果您熟悉丹尼尔·卡尼曼的著作《思考,快与慢》,您可以找到类似之处。一个系统提供快速的“直觉”想法,另一个系统提供更深思熟虑的理性决策。


通过使用合成数据(生成 1 亿个独特的几何问题和证明),研究人员可以在没有昂贵和有限的人类专家标注的情况下,训练 AlphaGeometry 的语言模型组件。这种近乎无限的新颖挑战促使系统扩展了其知识。


AlphaGeometry 在解决奥林匹克级的几何问题上的成功,不仅仅是一项学术成就。它展示了人工智能从事复杂的数学推理的潜力,这种技能长期以来被认为是人类智力的堡垒。虽然它目前的专长集中在几何学上,但这些方法理论上可以适应到其他数学领域。此外,该系统自主生成和解决复杂问题的能力,也为人工智能在各个领域的应用铺平了道路,从工程到理论研究。


通过开源 AlphaGeometry 的代码和模型,DeepMind 旨在为后续项目提供一个起点 —— 无论是公司内部还是外部的项目 —— 进一步增强人工智能的推理能力。组织之间的协作努力可能会导致未来具有更强的科学、逻辑和学习基础的 AGI。


研究人员指出,由于每次奥林匹克都有六个问题,其中只有两个通常是关注几何的,所以 AlphaGeometry 只能应用于给定奥林匹克的三分之一的问题。然而,它的几何能力使它成为世界上第一个能够通过 2000 年和 2015 年 IMO 的铜牌门槛的人工智能模型。

文章来源:https://www.maginative.com/article/deepminds-ai-masters-geometry-at-the-highest-levels/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消