近日,清华大学智能产业研究院(AIR)院长张亚勤院士发表了一场题为《AI大模型时代》的演讲,深入探讨了人工智能的发展历程、ChatGPT现象以及AIR在AI领域的研究概况和发展方向。
AI大趋势
过去三十年,IT行业最重要的变革是实现数字化。人工智能的发展离不开算力、算法和数据三大要素。过去十年,算力增加了10万倍,远超摩尔定律。数据作为新一代人工智能,特别是大模型的基石,其重要性不言而喻。数字化经历了三个阶段:1.0是内容的数字化,包括文本、音乐、图片、视频、语言等;2.0是企业的数字化,直接产物是云计算;现在进入3.0时代,包括信息、物理、生物世界的数字化。这一阶段的直接产物是海量数据,为人工智能的发展提供了坚实的基础。
ChatGPT现象
ChatGPT是InstructGPT的延伸,其重要的改进是指令微调和基于人类反馈的强化学习。从2018年的GPT-1到2020年的GPT-3,再到2022年的ChatGPT,大模型如雨后春笋般大量涌现。这些模型具有强大的自我演化能力,能够自我优化和进化,为产品开发和科研范式带来了新的变革。
AIR的研究方向
AIR是一个面向第四次工业革命的研究机构,致力于解决产业中的实际问题。其科研方向包括机器人和无人驾驶、智慧物联(特别是面向双碳的绿色计算、小模型部署到端等)以及智慧医疗(包括药物研发等)。基于计算机学科基础ABCD(Artificial Intelligence, Big Data, Cloud, Device),AIR的研究工作面向世界科技前沿、经济主战场、国家重大需求和人民生命健康来开展。
在大模型方面,AIR与产业紧密合作,重点在三个垂直产业做三个专业模型,称为垂直行业模型。同时,AIR也在探索如何提高模型效率,降低工程壁垒,让大模型更好地落地应用。此外,AIR还研究了模型边缘端部署工作,目标是通过模型轻量化和系统底层优化等手段,支撑模型在边缘端的高效运行。
总结与展望
我们正走向大模型时代,从过去多算法、多任务、多模型的数据驱动,到现在统一算法、多模态、预训练大模型的模型驱动。以ChatGPT为代表的新的技术通过了图灵测试,点亮了通用人工智能时代的曙光。基础大模型的几个特点包括Token-based、Scaling Law、规模效应下的涌现和统一等。在这些大模型上有垂直的模型、开源的模型、API和Plugin等,基于此打造新的2C、2B的应用生态将带来巨大的机遇和挑战。科学领域正进入一个被AI颠覆、重新定义的时代。