678CHAT AI资讯 DeepMind新出的AlphaGeometry2,厉害到能打败数学奥赛金牌选手

DeepMind新出的AlphaGeometry2,厉害到能打败数学奥赛金牌选手

谷歌 DeepMind 的最新成果 AlphaGeometry2 在数学领域的表现令人瞩目,它在解决国际数学奥林匹克竞赛(IMO)的几何问题上超越了平均金牌得主的水平。这一 AI 系统是 AlphaGeometry 的升级版本,能够解决过去 25 年间 IMO 几何问题的 84%,这一成绩标志着 AI 在数学推理领域迈出了重要一步。

DeepMind新出的AlphaGeometry2,厉害到能打败数学奥赛金牌选手插图

DeepMind 对于高中数学竞赛的关注并非偶然。他们认为,探索解决复杂几何问题的新方法,尤其是欧几里得几何,可能是提升 AI 能力的关键所在。数学定理的证明需要逻辑推理和在多个可能步骤中进行选择的能力,而这些能力对于未来的通用 AI 模型至关重要。

今年夏天,DeepMind 展示了将 AlphaGeometry2 与数学推理 AI 模型 AlphaProof 结合的系统,该系统在 2024 年 IMO 的六个问题中成功解决了四个。这种结合不仅在几何问题上表现出色,还可能扩展到其他数学和科学领域,例如复杂的工程计算。

AlphaGeometry2 的核心组成部分包括谷歌 Gemini 系列的语言模型和一个强大的 “符号引擎”。Gemini 模型能够通过数学规则推导出问题的可行解,帮助符号引擎更高效地工作。在解决 IMO 几何问题时,通常需要在图形中添加 “构造”,如点、线或圆。AlphaGeometry2 的 Gemini 模型能够预测哪些构造可能对解决问题有帮助。

值得注意的是,AlphaGeometry2 在训练过程中使用了 DeepMind 自己生成的超过 3 亿个定理和证明的合成数据。研究团队选择了过去 25 年中 IMO 的 45 个几何问题,并进行了扩展,最终形成了 50 个问题集。AlphaGeometry2 成功解决了其中的 42 个,这一成绩超越了金牌得主的平均得分。

尽管 AlphaGeometry2 取得了显著的成就,但它仍存在一些局限性。例如,它目前无法解决涉及可变数量点、非线性方程和不等式的问题。然而,这项研究已经引发了关于 AI 系统应该基于符号操作还是神经网络的讨论。AlphaGeometry2 采用了一种混合方法,结合了神经网络和基于规则的符号引擎。

AlphaGeometry2 的成功为通用 AI 的未来发展提供了新的方向。虽然目前它尚未完全自给自足,但 DeepMind 团队的研究表明,未来可能会有更多能够独立解决问题的 AI 模型问世。

划重点:

📊 AlphaGeometry2 能够解决过去 25 年 IMO 中 84% 的几何问题,超越了金牌得主的平均得分。

🔍 该系统结合了神经网络和符号引擎,采用混合方法解决复杂数学问题。

📈 DeepMind 希望通过解决几何问题,推动更强大通用 AI 的研究进展。

本文来自网络,不代表678CHAT立场,转载请注明出处:https://www.678chat.com/ai/9059.html

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部