国内AI大模型盘点,谁更有潜力?(附股)

AI百科6个月前更新 快创云
57 0

  目前,百度文心大模型、华为盘古大模型、腾讯混元大模型以及阿里通义大模型正加速追赶GPT模型。

  那么,何为大模型?其底层逻辑、参与者以及市场空间又是如何?本文将为您揭示这一切。

一、AI大模型探秘

  近半年,AI大模型层出不穷,从ChatGPT到文心一言,其在多场景下的广泛应用标志着AI大模型时代的到来。那么,究竟什么是AI大模型?它为何能被称为“大”?AI大模型指的是一个庞大而复杂的神经网络,通过存储更多参数来增加模型的深度和宽度,从而提高其表现能力。这些模型的参数规模通常从百亿起步,能够处理大量数据并产生高质量的预测结果。其中,OpenAI的GPT-3模型和PaLM-E便是典型的例子,分别拥有1750亿和5620亿的参数规模。

  相较于传统AI模型,大模型的优势在于:

  1. 解决AI碎片化与多样化问题。大模型通过“预训练+下游任务微调”的方式,从大量数据中捕获信息并存储于大量参数中,再进行微调,极大提升了模型的泛用性。
  2. 具备自监督学习功能,降低训练成本。大模型能减少对数据标注的依赖,使得大量无标记数据得以直接应用,降低了人工成本,并使得小样本训练成为可能。
  3. 突破结构变革的局限,提高模型精度。随着神经网络结构设计技术的成熟和趋同,通过优化结构来提升精度变得困难。但研究表明,更大的数据规模确实能提升模型的精度上限。

二、我国主要大模型概览

  中美在大模型的研发和落地方面展开了激烈竞争。国内主要的大模型厂商包括百度、腾讯、阿里、商汤、华为等,此外智源研究院和中科院自动化所等研究机构也参与其中,英伟达等芯片厂商也纷纷加入战局。

  数据、算法和算力是AI发展的三大驱动力,其中数据是基石。据IDC统计,中国数据规模预计将从2021年的18.51ZB增长至2026年的56.16ZB,年均增长速度CAGR为24.9%,增速位居全球第一。

  以下是几家主要大模型的详细介绍:

百度:文心一言大模型,AI应用场景全覆盖
2023年3月16日,百度发布了“文心一言”。该模型是百度研发的知识增强大语言模型,具备文学创作、商业文案创作、数理逻辑推理、中文理解和多模态生成五大能力。它基于百度ERNIE及PLATO系列模型研发而成,通过监督精调、人类反馈的强化学习等技术实现了性能上的重大进步。

腾讯:混元AI大模型,加速应用落地
腾讯于2022年底发布了国内首个低成本、可落地的NLP万亿大模型:混元AI大模型。该模型旨在打造业界领先的AI预训练大模型和解决方案,支持更多场景和应用。目前,HunYuan已覆盖NLP、CV、多模态等大模型领域,并在多个权威数据集榜单中登顶。

阿里:通义大模型,开源释放潜力
阿里达摩院一直深耕多模态预训练,并率先探索通用统一大模型。2021年,阿里发布了全球最大规模的多模态大模型M6,并于2022年发布了通义大模型系列。通义大模型注重开源开放,通过“统一范式”实现多模态、多任务、多结构的运行。

华为:盘古大模型,打造全栈使能体系
华为云于2021年发布了盘古系列超大规模预训练模型。该模型已发展出L0、L1、L2三大阶段的成熟体系。L0为基础模型,L1为行业模型,可直接应用于细分场景;L2为细分场景模型。

三、总结与展望

  目前,各大巨头在大模型技术上基本同源,且都具备资金、算力、人才和数据等发展条件。未来,这些巨头有望成为我国大模型的第一梯队。

  各家在应用场景上各有所长:百度在搜索和小度智能音箱等方面有优势;腾讯在微信、QQ和游戏等领域有应用场景;阿里在电商和钉钉等方面有应用场景;华为在2B应用方面独具优势。

  未来,各家将结合自身优势发力大模型的研发及应用落地。我国的大模型产业将迎来快速发展阶段。

参考资料
n
n- 华安证券-计算机行业深度报告:ChatGPT引发的大模型时代变革
n- 广发证券-计算机行业:多模态大模型方向确定… \n- 中信建投-人工智能行业海外大模型系列深度报告之一…

© 版权声明

相关文章