在线全职美工 DeepMind在解决数学问题方面达到里程碑——人工智能的下一个重大挑战

发布日期:2024-07-30 08:01    点击次数:69

在线全职美工 DeepMind在解决数学问题方面达到里程碑——人工智能的下一个重大挑战

2024年7月25日 DeepMind在解决数学问题方面达到里程碑——人工智能的下一个重大挑战 AlphaProof在今年的数学奥林匹克(Mathematical Olympiad)问题上展示了自己的实力——在用人工智能创建实质性证明的竞赛中迈出了一步在线全职美工。 大卫·卡斯特尔韦奇

图片

主题为“2016年第五十七届国际数学奥林匹克”的邮票小型张特写 国际数学奥林匹克中的问题来自几个数学领域。鸣谢:David Wong/南华早报via Getty 谷歌DeepMind在从围棋游戏到战略棋盘游戏的所有领域都击败了人类,现在它表示,它即将在解决数学问题方面击败世界顶级学生。 这家总部位于伦敦的机器学习公司于7月25日宣布,其人工智能(AI)系统已经解决了本月在英国巴斯举行的2024年国际数学奥林匹克(IMO)上向学校学生提出的六个问题中的四个。人工智能产生了严格的、一步一步的证明,由两名顶级数学家标记,并获得了28/42的分数——离金牌范围仅差一分。 “这显然是一个非常重大的进步,”英国剑桥的数学家约瑟夫·迈尔斯说,他与菲尔兹奖获得者蒂姆·高尔斯一起审查了这些解决方案,并帮助选择了今年IMO的原始问题。 DeepMind和其他公司正在进行一场竞赛,最终让机器给出证明,解决数学中的实质性研究问题。该公司表示,在国际数学家大会(IMO)上设置的问题——世界上最重要的年轻数学家竞赛——已经成为实现这一目标的进展基准,并被视为机器学习的“重大挑战”。 “这是第一次任何人工智能系统能够实现奖牌级别的性能”,DeepMind负责科学的人工智能副总裁Pushmeet Kohli在向记者发布的一份简报中说。“这是构建高级定理证明器的旅程中的一个关键里程碑,”Kohli说。 分支 就在几个月前的一月份,DeepMind系统AlphaGeometry在解决一种类型的IMO问题(欧几里德几何中的问题)时,已经达到了奖章获得者级别的性能。第一个在整体测试中表现出金牌水平的人工智能——包括代数、组合学和数论等通常被认为比几何更具挑战性的问题——将有资格获得500万美元的奖励,称为人工智能数学奥林匹克(AIMO)奖。(该奖项有严格的标准,如开源代码和有限的计算能力,这意味着DeepMind目前的努力不符合条件。) 在他们最近的努力中,研究人员使用AlphaGeometry2在20秒内解决了几何问题;DeepMind计算机科学家Thang Luong表示,人工智能是他们创纪录系统的改进和更快版本。 对于其他类型的问题,该团队开发了一个全新的系统,名为AlphaProof。AlphaProof解决了竞赛的两个代数问题,外加一个数论问题,花了三天时间。(实际IMO的参与者有两次会议,每次4.5小时。)它无法解决数学的另一个领域组合学中的两个问题。

图片

一名罗马尼亚选手在第63届国际数学奥林匹克竞赛中获得金牌的特写镜头。 数学奥林匹克是世界上学龄数学天才的首要竞赛。信用:MoiraM/Alamy当试图用语言模型回答数学问题时,研究人员获得了喜忧参半的结果——这种类型的系统为ChatGPT等聊天机器人提供了动力。有时,模型给出了正确的答案,但不能合理地解释他们的推理,有时他们吐出废话。 就在上周,来自软件公司Numina和HuggingFace的一组研究人员使用一种语言模型赢得了AIMO中级“进步奖”,该奖基于IMO问题的简化版本。这些公司将他们的整个系统开源,供其他研究人员下载。但是获奖者告诉《自然》杂志,要解决更难的问题,单靠语言模型可能还不够。 a级求解器 AlphaProof将语言模型与强化学习技术相结合,使用该公司已成功用于攻击围棋等游戏以及一些特定数学问题的“AlphaZero”引擎。在强化学习中,在线美工神经网络通过反复试验来学习。当它的答案可以用一些客观的度量标准来评估时,这种方法很有效。出于这个目的,AlphaProof被训练用一种叫做Lean的正式语言读写证明,这种语言被用在数学家流行的同名软件包“证明助手”中。为此,AlphaProof通过在精益包中运行它们来测试其输出是否正确,这有助于填充代码中的一些步骤。 训练任何语言模型都需要大量的数据,但是在精益中几乎没有可用的数学证明。DeepMind机器学习研究人员托马斯·休伯特(Thomas Hubert)说,为了克服这个问题,该团队设计了一个额外的网络,试图将现有的用自然语言写的100万个问题的记录翻译成精益,但不包括人类写的解决方案,他是AlphaProof的开发负责人之一。“我们的方法是,我们能学会证明吗,即使我们最初没有训练人类书写的证明?”(该公司对围棋采取了类似的方法,其人工智能通过与自己对弈来学习下棋,而不是像人类那样。) 魔法钥匙 许多精益翻译都是无意义的,但足够好了,足以让AlphaProof开始它的强化学习周期。高尔斯在新闻发布会上说,结果比预期好得多。“IMO中的许多问题都有这种神奇的特性。巴黎法兰西学院的高尔斯说:“这个问题起初看起来很难,直到你找到一把神奇的钥匙来解开它。 在某些情况下,AlphaProof似乎能够提供额外的创造性飞跃,在无限大的可能性范围内提供正确的一步。高尔斯补充说,但是还需要进一步的分析来确定答案是否没有看起来那么令人惊讶。在DeepMind的AlphaGo机器人在2016年击败世界顶级人类围棋选手的著名比赛中采取了令人惊讶的“37步棋”之后,类似的辩论随之而来——这是人工智能的分水岭。 迈尔斯在新闻发布会上说,这些技术是否能完善到在数学领域做研究水平的工作还有待观察。“它能延伸到其他种类的数学吗?在这些数学中,可能没有一百万个问题需要训练。” DeepMind计算机科学家大卫·西尔弗(David Silver)说,“我们现在可以证明,他们不是公开的研究问题,而是至少对世界上最优秀的年轻数学家来说非常具有挑战性的问题,”他在2010年代中期是开发AlphaGo的主要研究人员。doi::https://doi.org/10.1038/d41586-024-02441-2

在线设计师 本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。 特别声明:以上内容(如有图片或视频亦包括在内)来源于网络,不代表本网站立场。本网站仅提供信息存储服务。如因作品内容、版权和其他问题需要同我们联系的,请联系我们及时处理。联系方式:451255985@qq.com,进行删除。