AI科学家:迈向全自动化开放式科学发现
人工通用智能的一个重大挑战是开发能够进行科学研究和发现新知识的智能体。尽管当前的前沿模型已用于辅助人类科学家,如头脑风暴、编写代码或预测任务,但它们仅完成了科学过程的一小部分。本文提出了首个用于完全自动化科学发现的综合框架,使前沿大型语言模型(LLMs)能够独立进行研究并传达其发现。
AI科学家的功能
AI科学家能够生成新颖的研究想法,编写代码,执行实验,展示结果,并通过撰写完整的科学论文来描述其发现。随后,它还会进行模拟的审稿过程进行评估。这一过程可以反复进行,以迭代发展思想,并将其添加到一个不断增长的知识档案中。我们通过将这一方法应用于机器学习的三个不同子领域:扩散建模、基于Transformer的语言建模和学习动态,展示了其多功能性。每个想法都得以实现并发展为一篇完整的论文,成本低至每篇不到15美元。
自动化审稿流程
为了评估生成的论文,我们设计并验证了一种自动化审稿人。实验表明,该审稿人在评估论文得分时达到了近乎人类的性能。AI科学家可以生成超过顶级机器学习会议接受标准的论文,标志着机器学习科学发现新时代的开始。我们的代码已在GitHub开源。
现代科学方法
现代科学方法被认为是启蒙运动的最大成就之一。传统上,一名人类研究者会收集背景知识,提出假设,设计评估程序,收集证据,并评估及传达发现。然而,这一过程受到人类研究者创造力、背景知识和有限时间的限制。在人工智能领域,研究者们设想通过使用AI来自动化AI研究的可能性。最近,基础模型在通用能力方面取得了巨大进步,但它们目前仅在加速研究流程的部分环节中展示了潜力。
研究自动化方法
传统的研究项目自动化方法依赖于严格限制潜在发现的搜索空间,这大大限制了探索的范围。例如,材料发现和合成生物学领域取得了显著进展,但探索被限制在预定义参数的已充分表征领域内。在机器学习领域,研究自动化主要限于超参数和架构搜索或算法发现内的手工制作搜索空间。然而,这些方法仍然受到严格定义的搜索空间和目标的限制。
AI科学家的管道
AI科学家是一个由基础模型支持的端到端科学发现过程。在给定研究方向和一个初始代码库的情况下,AI科学家可以无缝地执行想法生成、文献搜索、实验规划、实验迭代、手稿写作和同行评审。此外,AI科学家可以在一个开放式循环中运行,基于之前的科学发现改进下一代想法。这使我们能够以低成本加速科学迭代过程。
贡献与总结
我们的贡献包括:引入了首个用于机器学习研究的端到端完全自动化科学发现框架;引入了基于基础模型的审稿流程;展示了AI科学家在扩散建模、语言建模和grokking中的一些新颖见解;讨论了方法的局限性、伦理考虑和未来展望。AI科学家的推出标志着朝着实现AI在科学研究中的全部潜力迈出了重要的一步。通过自动化发现过程并结合AI驱动的审查系统,我们为在科学和技术最具挑战的领域中无限创新和解决问题的可能性打开了大门。