DeepMind新出的AlphaGeometry2，厉害到能打败数学奥赛金牌选手

谷歌 DeepMind 的最新成果 AlphaGeometry2 在数学领域的表现令人瞩目，它在解决国际数学奥林匹克竞赛（IMO）的几何问题上超越了平均金牌得主的水平。这一 AI 系统是 AlphaGeometry 的升级版本，能够解决过去 25 年间 IMO 几何问题的 84%，这一成绩标志着 AI 在数学推理领域迈出了重要一步。

DeepMind 对于高中数学竞赛的关注并非偶然。他们认为，探索解决复杂几何问题的新方法，尤其是欧几里得几何，可能是提升 AI 能力的关键所在。数学定理的证明需要逻辑推理和在多个可能步骤中进行选择的能力，而这些能力对于未来的通用 AI 模型至关重要。

今年夏天，DeepMind 展示了将 AlphaGeometry2 与数学推理 AI 模型 AlphaProof 结合的系统，该系统在 2024 年 IMO 的六个问题中成功解决了四个。这种结合不仅在几何问题上表现出色，还可能扩展到其他数学和科学领域，例如复杂的工程计算。

AlphaGeometry2 的核心组成部分包括谷歌 Gemini 系列的语言模型和一个强大的 “符号引擎”。Gemini 模型能够通过数学规则推导出问题的可行解，帮助符号引擎更高效地工作。在解决 IMO 几何问题时，通常需要在图形中添加 “构造”，如点、线或圆。AlphaGeometry2 的 Gemini 模型能够预测哪些构造可能对解决问题有帮助。

值得注意的是，AlphaGeometry2 在训练过程中使用了 DeepMind 自己生成的超过 3 亿个定理和证明的合成数据。研究团队选择了过去 25 年中 IMO 的 45 个几何问题，并进行了扩展，最终形成了 50 个问题集。AlphaGeometry2 成功解决了其中的 42 个，这一成绩超越了金牌得主的平均得分。

尽管 AlphaGeometry2 取得了显著的成就，但它仍存在一些局限性。例如，它目前无法解决涉及可变数量点、非线性方程和不等式的问题。然而，这项研究已经引发了关于 AI 系统应该基于符号操作还是神经网络的讨论。AlphaGeometry2 采用了一种混合方法，结合了神经网络和基于规则的符号引擎。

AlphaGeometry2 的成功为通用 AI 的未来发展提供了新的方向。虽然目前它尚未完全自给自足，但 DeepMind 团队的研究表明，未来可能会有更多能够独立解决问题的 AI 模型问世。

划重点：

📊 AlphaGeometry2 能够解决过去 25 年 IMO 中 84% 的几何问题，超越了金牌得主的平均得分。

🔍 该系统结合了神经网络和符号引擎，采用混合方法解决复杂数学问题。

📈 DeepMind 希望通过解决几何问题，推动更强大通用 AI 的研究进展。

微信扫一扫：分享

相关文章

AI军火库战略曝光！联想CTO揭秘三大「智能体梦工厂」作战图

OpenAI宫斗再揭秘：投资人示警未果 阿尔特曼险遭资本驱逐

Wayve祭出驾驶界「五维沙盘」：GAIA-2模型可生成五视角视频，模拟「死神来了」级路况

慢增长时代的突围战：快手的AI「换血」能解估值困局吗？

具身智能战国时代：BATJ华为小米千亿押注，中国军团剑指全球AI王座

教育新基建升级！腾讯混元大模型实战课入选「国家队」 首套AI通识课体系发布

发表回复 取消回复

OpenAI宫斗再揭秘：投资人示警未果阿尔特曼险遭资本驱逐

教育新基建升级！腾讯混元大模型实战课入选「国家队」首套AI通识课体系发布

发表回复取消回复