数学家们正努力解释使用AI人工智能揭示的椭圆曲线中的不寻常行为。
如果以正确的视角看待,椭圆曲线可以像鸟群一样聚集。
视频:Paul Chaikin
椭圆曲线是现代数学中最迷人的对象之一。它们看似简单,却在从高中到高深研究的数学之间搭建了一条高速公路。它们是安德鲁·怀尔斯证明费马大定理的核心,也是现代密码学的关键工具。2000年,克莱数学研究所将关于椭圆曲线统计的猜想——BSD猜想列为“七大千禧年问题”之一,每解决一个问题可获得100万美元的奖金。这一猜想由布莱恩·伯奇和彼得·斯温纳顿-戴尔在20世纪60年代首次提出,至今仍未得到证实。
理解椭圆曲线是一项高风险但重要的工作,一直是数学的核心。因此,当2022年一个跨大西洋的合作项目利用统计技术和AI人工智能发现椭圆曲线中完全出乎意料的模式时,这被视为一个重大贡献。“机器学习带着一些有趣的东西来到我们的门口只是时间问题,”普林斯顿高等研究院及普林斯顿大学的数学家彼得·萨纳克说。起初,没有人能解释为何这些新模式存在。此后,在最近的一系列论文中,数学家们开始揭示这些模式背后的原因,并开始证明它们不仅存在于2022年研究的特定例子中,还会出现在更普遍的椭圆曲线中。
为了理解这些模式,我们需要了解什么是椭圆曲线以及数学家如何对它们进行分类。
椭圆曲线将一个变量的平方与另一个变量的三次幂联系起来:y^2 = x^3 + Ax + B,其中A和B是两个满足某些简单条件的数。该方程定义了一条可以在平面上绘制的曲线。尽管名称相似,但椭圆并不是椭圆曲线!
尽管椭圆曲线看起来很普通,但它成为数论学家的强大工具。数学家们喜欢将变量x和y限制在不同的数字系统中,而不是在所有数字上变化。限制在有理数(可以写成分数的数字)上的椭圆曲线特别有用。“实数或复数椭圆曲线相当无聊。”萨纳克说:“只有有理数才有深度。”
如果在椭圆曲线上的两个有理点之间画一条直线,那条直线与曲线相交的地方也是有理的。你可以使用该事实来定义椭圆曲线中的“加法”。在P和Q之间画一条直线,这条直线将与曲线相交于第三点R。R关于x轴的反射(对称点)就是P + Q的和。曲线上所有的解与这种加法运算一起形成一个称为群(group)的数学对象。
数学家用它来定义曲线的“秩”(rank)。曲线的秩与它所具有的有理解的数目有关。秩为0的曲线有有限个解。具有更高秩的曲线具有无穷多个解,这些使用加法运算得到的解之间的关系由秩描述。
人们对秩还不太了解;数学家们并不总是有办法计算它们,也不知道它们能有多大。(已知一条特定曲线的最大精确秩为20。)看起来相似的曲线可能有完全不同的秩。
椭圆曲线也与素数(大于1且只能被1和它们自身整除的正整数)有很大关系。数学家特别关注有限域(为每个素数定义的循环算术系统)上的曲线。一个有限域就像一个钟面上的小时数等于某个素数的时钟:如果你一直向上数,数字就会重新开始。例如,在素数7有限域中,5加2等于0,5加3等于1。
椭圆曲线有一个相关的数列ap,它与素数p有限域中曲线的解的数量有关。虽然秩很难计算,但数列ap要容易得多。在极早期的一台计算机上进行大量计算的基础上,伯奇和斯温纳顿-戴尔证明了椭圆曲线的秩和数列ap之间的关系。任何能证明他们的猜想正确的人都能赢得一百万美元和数学上的不朽名声。
一个令人惊讶的模式出现了
疫情开始后,伦敦数学科学研究所的研究员Yang-Hui He决定接受一些新的挑战。他在大学里主修物理,并在MIT获得数学物理博士学位。但他对数论越来越感兴趣,鉴于人工智能的能力越来越强,他认为他应该尝试使用人工智能作为一种工具来寻找数字中的意外模式。(他已经在使用机器学习来分类卡拉比-丘流形。)
当Kyu-Hwan Lee(左)和Thomas Oliver(中)开始与Yang-Hui He(右)合作使用人工智能来寻找数学模式时,他们希望这只是一种玩乐,而不是一个会导致新发现的艰难尝试。图源:Yang-Hui He 2020年8月,随着疫情的加深,诺丁汉大学邀请他参加了一场在线讲座。他对自己取得的进展以及利用机器学习发现新数学的可能性感到悲观。“他的叙述是,数论很难,因为你不能用机器学习来学习数论中的东西,”威斯敏斯特大学数学家托马斯·奥利弗说。奥利弗当时也在观众席上。他回忆说:“我发现不了任何东西,因为我不是专家。”他甚至没有用正确的方式看待这个问题。”奥利弗和康涅狄格大学的数学家Kyu-Hwan Lee开始与他合作。“我们决定这样做只是为了了解机器学习是什么,而不是认真学习数学。”奥利弗说:“但我们很快发现你可以用机器学习来学习很多东西。”奥利弗和李建议他用其技术研究L-函数,即与通过数列ap的椭圆曲线密切相关的无穷级数。他们可以使用椭圆曲线及其相关L-函数的在线数据库(称为LMFDB https://www.lmfdb.org)来训练机器学习分类器。当时,数据库中有300多万条有理数域椭圆曲线。到2020年10月,他们发表了一篇论文 https://arxiv.org/abs/2010.01213 ,利用从L-函数中收集的信息来预测椭圆曲线的一个特定性质。去年11月,他们分享了另一篇论文 https://arxiv.org/abs/2011.08958 ,利用机器学习对数论中的其他对象进行分类。到12月,他们已经能够高精度地预测椭圆曲线的秩 https://arxiv.org/abs/2012.04084 。但他们不确定为什么他们的机器学习算法工作得这么好。李让他的本科生阿列克谢·波兹尼亚科夫看看他是否能弄清楚这是怎么回事。碰巧的是,LMFDB根据一个称为导子的量对椭圆曲线进行分类,导子总结了曲线无法表现良好的素数的信息。因此波兹尼亚科夫试图同时观察大量具有类似导子的曲线——比如说所有导子在7500到10000之间的曲线——总计约10000条曲线。其中有一半秩为0,一半秩为1。(更高的秩非常罕见。)然后他对所有秩为0、1的曲线的ap值分别取平均值并绘制结果。这两组点形成了两条清晰可辨的波浪这就是机器学习分类器为什么能够正确地确定特定曲线秩的原因。“起初我只是为完成了这项任务感到高兴。”波兹尼亚科夫说:“但Kyu-Hwan立即意识到这种模式令人惊讶那就是它变得真正令人兴奋的时候。”李和奥利弗被迷住了。“阿列克谢给我们看了这张照片我说这看起来像是鸟类做的事情”奥利弗说。“然后Kyu-Hwan查了一下说这叫椋鸟群飞然后杨说我们应该把这篇论文叫做‘椭圆曲线的椋鸟群飞’。”他们在2022年4月上传了自己的论文并转发给了其他少数数学家紧张地期待着被告知他们所谓的“发现”是众所周知的奥利弗说这种关系如此明显早就应该注意到了这篇预印本论文几乎立刻就引起了人们的兴趣特别是麻省理工学院的研究科学家安德鲁·萨瑟兰他是LMFDB的总编辑之一萨瑟兰意识到300万条椭圆曲线对他的目的来说是不够的他想看看更大的导子范围看看有多鲁棒的椋鸟群飞他从另一个大约1.5亿条椭圆曲线的巨大数据库中提取数据他仍然不满意然后从另一个存储库中提取了3亿条曲线的数据“但即使是这些都是不够的所以我实际上计算了一个新的超过十亿椭圆曲线的数据集用来计算真正的高分辨率图片”萨瑟兰说这些椋鸟群飞显示了他是一次性平均了超过15000条椭圆曲线还是超过100万条即使他观察越来越大的素数曲线形状也保持不变这种现象称为标度不变性(scale invariance)萨瑟兰还意识到椋鸟群飞并不是椭圆曲线所独有的它也出现在更一般的L-函数中他写了一封信 https://math.mit.edu/~drew/RubinsteinSarnakLetter.pdf 总结了他的发现并把它寄给了滑铁卢大学的Sarnak和Michael Rubinstein然而他们并不知道解释模式李、何和奥利弗于2023年8月在布朗大学数学计算与实验研究所(ICERM)组织了一个关于椋鸟群飞的研讨会Sarnak和Rubinstein来了还有Sarnak的学生Nina Zubrilina(尼娜·祖布里琳娜)Zubrilina介绍了她对模形式中的椋鸟群飞模式的研究模形式即像椭圆曲线的特殊复函数有与其相关的L-函数在具有大导子的模形式中椋鸟群飞会聚成一个清晰的曲线而不是形成一个可辨别但分散的模式在2023年10月11日发表的一篇论文中 https://arxiv.org/abs/2310.07681 Zubrilina证明了这种类型的椋鸟群飞遵循她发现的明确公式“尼娜的最大成就是她给出了一个公式;我称之为Zubrilina椋鸟群飞密度公式”Sarnak说“她用非常复杂的数学证明了一个精确的公式完全与数据相符”她的公式很复杂但Sarnak称赞它是一种重要的新函数可与Airy函数相媲美Airy函数定义了从光学到量子力学等各种物理学背景下使用的微分方程的解虽然Zubrilina的公式是第一个但其他的都随之而来“现在每周都有一篇新论文发表”Sarnak说“主要是使用Zubrilina的工具解释椋鸟群飞的其他方面”布里斯托大学的Jonathan Bober(乔纳森·博伯)、Andrew Booker(安德鲁·布克)和Min Lee(李敏)以及ICERM的David Lowry-Duda(大卫·劳里-杜达)在10月份的另一篇论文中证明了一种不同类型的模形式的椋鸟群飞的存在 https://arxiv.org/abs/2310.07746v1 Kyu-Hwan Lee、奥利弗和Pozdnyakov证明了在与L-函数密切相关的称为狄利克雷特征的对象中存在椋鸟群飞 https://arxiv.org/abs/2307.00256 萨瑟兰对发现椋鸟群飞的运气印象深刻如果椭圆曲线数据没有被导子排序椋鸟群飞就会消失“他们很幸运能从LMFDB获取数据这些数据是根据导子预排序的”他说“这就是椭圆曲线与相应的模形式之间的关系但这一点也不明显两条方程看起来非常相似的曲线可能有非常不同的导子”例如萨瑟兰指出y^2 = x^3 – 11x + 6有导子17但将负号翻转为加号y^2 = x^3 + 11x + 6有导子100736即使在那时这些椋鸟群飞也只是因为波兹尼亚科夫缺乏经验而被发现的“如果没有他我不认为我们会找到它”奥利弗说“因为专家们传统上将ap的绝对值归一化但他没有将它们归一化……所以振荡非常大而且可见”奥利弗指出AI人工智能算法用来按秩对椭圆曲线进行排序的统计模式存在于一个有数百个维度的参数空间中——太多了人们无法在脑海中进行排序更不用说可视化了但是尽管机器学习发现了隐藏的振荡“直到后来我们才明白它们是椋鸟群飞”