全球最强开源大模型易主!Mate推出最新开源大模型Llama 3,有望赶超OpenAI【附AIGC行业发展现状分析】

AI百科6个月前更新 快创云
63 0

  随着人工智能技术的快速发展,大模型成为企业竞相追逐的热门领域。在语音识别、自然语言处理、图像识别等多个领域,大模型展现出巨大的应用潜力,促使科技巨头们纷纷加大投入,研发更为强大的模型,以提升系统的性能和智能化水平。

  近期,Meta在官网上宣布了旗下最新开源大模型Llama 3的发布。目前,该模型已开放80亿和700亿参数的两个版本。据Meta官方介绍,Llama 3在24K GPU集群上基于超过15T的数据进行了训练,其数据集比Llama 2大7倍,代码多4倍,且支持8K上下文长度,是Llama 2的两倍。未来,Meta计划推出更大参数的Llama 3版本,其参数将超过4000亿,成为迄今为止最先进的开源模型,对包括OpenAI在内的大模型公司形成强有力的竞争。

  对于Meta的这一举动,业界对大模型开源的看法不一。百度CEO李彦宏曾表示,开源模型将越来越落后。他认为,在大模型场景下,开源实际上是最昂贵的选择。而360集团创始人周鸿祎则持不同观点,他坚信开源的力量,并鼓励企业和开发者们充分利用开源资源,共同推动科技进步。

  从“Meta推出最新开源大模型”这一事件回看AIGC行业的发展:

  AI大模型作为新的智能计算范式,通过基于大型预训练模型和生成对抗网络等人工智能技术,从已有数据中寻找规律并生成相关内容。与传统AI模型相比,大模型使用更多数据,具有更好的泛化性,可应用于更广泛的下游任务中。按照应用场景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。例如,GPT-3、源、悟道和文心等是业界典型的自然语言大模型;视觉大模型已广泛应用于自动驾驶、智能安防和医学影像等领域;基于多模态大模型的以文生图技术也在迅速发展。

  大模型已成为人工智能领导者的竞争焦点。预训练大模型是人工智能产业发展的必然选择,基于海量行业数据和知识,通过强大算力集群预先训练基础模型,并结合应用场景的数据和各类需求进行“工业化”的高效率开发。开发者利用预训练大模型只需少量数据即可快速开发出精度更高、泛化能力更强的行业模型。这不仅可以提升人工智能项目的开发效率,还能降低研发成本和缩短研发时间。

  根据Omdia的数据,中国开发者对基于昇思MindSpore打造的盘古NLP大模型最感兴趣。盘古NLP大模型在技术上处于领先地位,具有千亿参数和40TB的中文文本数据学习能力;在多个场景下可覆盖语言处理任务和需求;对开发者友好且可跨平台快速调用。这也从侧面验证了盘古大模型的开放性。

  在AIGC行业的主要企业中,互联网大厂的业务布局最广且进行了宏观战略布局;而初创企业也在细分赛道上取得了一定成绩。目前中国已出现多家从事大模型开发及延展应用的公司但尚未普遍形成对外开放的生态需进一步关注相关机构的后续动态。

  前瞻产业研究院预测显示2023-2025年是我国AIGC产业市场规模增长的第一阶段增长率约为25%至2025年市场规模达到约260亿人民币。随着行业生态的完善特别是底层大模型的对外开放应用层的蓬勃发展将带动产业快速增长年复合增长率将超过70%。预计至2027年我国AIGC产业规模将超过600亿人民币;从2028年开始AIGC产业将延展出完整产业链并在商业化场景上持续拓宽加深进而深入变革行业。未来我国AIGC产业规模将持续保持高速增长至2030年市场规模有望超过万亿人民币。

© 版权声明

相关文章