中国AI企业发布开源模型 美国科技公司跌倒一大片

AI百科5个月前更新 快创云
43 0

中国AI企业DeepSeek发布新模型,撼动全球科技市场

  中国人工智能(AI)企业深度求索(DeepSeek)近期发布了其最新开源模型DeepSeek-R1,以较低的成本实现了接近美国开放研究中心(OpenAI)开发的GPT-o1的性能。这一突破性进展打破了全球AI产业长期以来依赖大量算力的传统路径,对资本市场产生了深远影响。消息传出后,美国科技行业巨头纷纷震动,1月27日,英伟达市值单日蒸发近6000亿美元,美国上市科技企业总市值更是单日缩减约1万亿美元。业界普遍认为,DeepSeek模型有望引领一波创新浪潮,推动全球AI技术的进一步发展。

“更大并非更聪明”

  据深度求索公司介绍,DeepSeek-R1在后训练阶段广泛采用了强化学习技术,即便在标注数据稀缺的情况下,也极大提升了模型的推理能力。在数学、代码、自然语言推理等任务中,其性能与GPT-o1模型正式版不相上下。国际投行摩根士丹利指出,“更大(的模型)不再等于更聪明”,DeepSeek通过显著提升数据质量和优化模型架构,展示了一条与现有大模型截然不同的高效训练路径。摩根士丹利表示,DeepSeek模型的成本远低于国际知名大模型,大约低了一个数量级。

  高盛集团也认同DeepSeek新模型的成本优势,这将降低开发大模型的门槛,使得互联网巨头可能面临来自初创公司的激烈竞争。英国《金融时报》发表的一篇评论文章指出,DeepSeek挑战了AI产业的核心信念,即更强硬件是推动AI发展的关键。

股市动荡,纳指狂跌3%

  DeepSeek在AI领域的这一进展迅速在业界和媒体中发酵,引发市场对巨资构建AI大语言模型合理性和前景的质疑。部分投资者开始抛售此前受益于AI投资热的科技股。1月27日,英伟达股价暴跌16.97%,市值蒸发近6000亿美元,创下美国上市公司单日市值损失纪录。博通公司、台积电和甲骨文公司股价跌幅均超过13%。

  当天,纳斯达克综合指数下跌612.47点,收于19341.83点,跌幅为3.07%。科技板块同样领跌其他主要股指。市场人士惊呼这一意外的同时,也对美国推动的AI巨额投资计划产生更大质疑,认为存在投资过度嫌疑。有评论认为,市场实践证明可以开发出成本更低、性能同样强大的AI模型,这将从根本上改变AI产业链的投资逻辑。

  事实上,AI产业板块是推动美股过去两年大幅上涨的主要力量。这期间,纳斯达克100指数在AI板块加持下上涨约90%,总市值增长超过14万亿美元。但长期享受的高溢价正受到越来越多质疑。此次暴跌暴露了科技巨头高估值、高投资及市值高度集中带来的脆弱性,其股价下跌、估值回归也在预期之中。

或激发创新浪潮

  摩根士丹利认为,DeepSeek的模型表明前沿AI能力可能无需大量计算资源就能实现。通过巧妙的工程设计和高效的训练方法,高效利用资源可能比纯粹的计算能力更重要。这可能会激发一波创新浪潮,促使企业探索具有成本效益的AI开发和部署方法。DeepSeek的模型是开源共享的,多个团队已宣布复现了DeepSeek-R1的训练过程。美国“元”公司首席AI科学家杨立昆在社交媒体上表示,DeepSeek-R1的面世意味着正在超越闭源模型。

  英国《金融时报》的评论文章说,开源模型DeepSeek-R1对全球用户极具吸引力,有助于推动AI技术的开发和应用。文章指出,对于大多数商业用户来说,拥有一款足够可靠且好用的模型比拥有绝对领先的模型更重要。“并非每个司机都需要一辆法拉利。”像R1这样模型的推理能力进步可能带来突破性变化。如果能以更低的成本拥有这些模型,企业的盈利能力将得到提升。

DeepSeek如何引发美国科技业震动?

高性价比:冲击美国大模型垄断地位

  DeepSeek以极低的成本实现了与世界顶尖大模型比肩的性能。据报道,OpenAI训练ChatGPT-4的成本高达7800万美元至1亿美元,而DeepSeek大模型的训练成本不到600万美元,仅为同性能模型的5%到10%。新模型训练方法大幅降低了大模型行业的入局门槛,大规模预训练不再是科技巨头的专利。

模式创新:引发美高新技术人员恐慌

  DeepSeek的开发成本远低于美国大模型,关键在于其采用了不同的训练模式。它摒弃了美国堆砌算力的方式,选择通过优化数据处理和选择性喂养来实现性能提升和成本降低。目前看Meta耗费了大量资金训练Llama但效果不佳而反观成本低廉的DeepSeek效果显著这引发了美国不少企业技术人员的恐慌他们担心自己被质疑技术能力和创新性从而失去工作。

© 版权声明

相关文章