谷歌DeepMind的AI在IMO竞赛中再度取得突破,AlphaGeometry 2不仅成功拿下金牌,还在短短六个月内实现了从54%到84%的解题率提升。这一成就归功于其全新设计的基于知识共享集成的搜索树(SKEST)算法,该算法允许多个集束搜索并行运行并相互帮助,从而大幅提升了解决复杂几何问题的能力。
AlphaGeometry 2在2000-2024年的IMO几何题上表现出色,不仅解决了42道题目,还首次破解了2009年IMO最难几何题。这一成就令人瞩目,超越了历年IMO金牌得主的平均水平。
除了解题率的提升,AlphaGeometry 2还实现了几个重大升级。它采用了基于Gemini的更强大语言模型,并在更大更多样化的数据集中完成训练,显著提升了理解和推理能力。同时,引入的符号引擎更加快速稳健,融入了简化规则集、增强双重点处理等优化。此外,模型领域语言范围也进行了扩展,涵盖了更广泛的几何概念。
在自动形式化和图形生成方面,AlphaGeometry 2通过新的方法将自然语言几何问题转化为专用语言,并实现了自动图形生成算法。此外,它还采用了两阶段数值优化方法来解决无法直接通过几何作图构建的图形。
值得一提的是,AlphaGeometry 2在处理重合点方面的能力有了显著提升,这使它能够更灵活地处理各种几何问题。此外,它的DDAR算法也进行了优化,使得搜索速度和效率大幅提升。
在训练方面,AlphaGeometry 2使用了更大、更多样化、更复杂的数据集来生成合成训练数据。这显著提升了模型的性能,使得它在解决复杂几何问题时更加高效和准确。
总的来说,AlphaGeometry 2的卓越表现展示了AI在几何证明领域的巨大潜力。尽管目前还有部分高级几何解法技巧尚未实现,但这一成就无疑为未来的研究和发展奠定了坚实基础。
参考资料:HNYZs
https://arxiv.org/pdf/2502.03544