什么是 DeepSeek?为什么它会颠覆人工智能领域?

AI百科2周前更新 快创云
12 0

  今年,中国农历蛇年的春节假期,AI科技界最引人注目的两个亮点莫过于Deepseek和OpenAI ChatGPT类似的产品,以及春晚表演的人形机器人。其中,Deepseek推理模型R1的推出更是引发了全球关注,美国总统川普称其为“A wakeup call”,这一模型的推出导致AI芯片巨头英伟达股价暴跌17%,市值缩水6000亿美元,创下股市历史上公司单日最大跌幅。芯片设备制造商ASML和另一家芯片公司博通的股价也分别下跌6%和17%。对美国AI科技界而言,这无异于一次“珍珠港事件”。

  Deepseek是由中国初创公司于2023年推出的最新人工智能模型,据称这些模型在性能上与美国行业领先的模型如ChatGPT、Gemini、Claude、Llama相当甚至更好,但成本却只是其一小部分。这一举措有可能颠覆科技世界的秩序。根据Deepseek发布的论文信息,其Deepseek-V3的训练仅需价值不到600万美元的Nvidia H800芯片计算能力,此举引起了全球人工智能界的关注。在苹果App Store上,由Deepseek-V3支持的Deepseek人工智能助手已超越竞争对手ChatGPT及谷歌的Gemini,成为评分最高的免费应用程序。

  这一成就引发了人们对美国科技公司决定在人工智能领域投入数十亿美元理由的质疑,包括英伟达在内的几家大型科技公司的股价也受到冲击。Deepseek与OpenAI的比较显示,两者在多个方面存在显著差异,包括创立时间、使命、主要型号、开发成本、使用方法、所有权、绩效等。Deepseek以经济高效的模型颠覆了人工智能的规范,与微软合作的行业领导者致力于促进透明度和共担责任。

  那么,Deepseek为何会引起如此大的轰动呢?2022年底,OpenAI ChatGPT的发布引发了AI领域的新浪潮,其大语言模型能够类人对话和生产内容,震惊了科技界。中国的科技公司纷纷创建自己的人工智能聊天机器人,但在搜索引擎巨头百度发布首个中文版ChatGPT之后,国内对中美企业在人工智能能力方面的差距普遍感到失望。直到去年,Deepseek模型的质量和成本效率彻底颠覆了这种说法。Deepseek表示,其Deepseek-V3和Deepseek-R1模型受到了硅谷高管和美国科技公司工程师的一致好评,与OpenAI和Meta等最先进的模型不相上下,且使用成本更低。据Deepseek官方微信账号上的一篇文章称,上周发布的Deepseek-R1的使用成本比OpenAI o1模型低20到50倍。

  然而,一些人公开对Deepseek的成功故事表示怀疑。首先,根据马斯克推特上转发的Gavin Baker内容,500万到600万美元的训练成本具有误导性。实际上,开发这样的模型需要多次运行训练或其某种变体,并进行许多其他实验,这使得成本高出很多倍。此外,购买用于训练的H800卡的成本也相当高。关于Deepseek的算力来源也存在疑问,有猜测称其算力可能来自于新加坡或沙特等地区的服务。

  除了成本怀疑之外,不少人表示Deepseek采用“蒸馏”策略赶上美国人工智能公司。然而,从工程应用角度来看,Deepseek的突破是史诗级的。无论如何,Deepseek在AI科技史上无疑是一个重大且具有里程碑意义的产品和事件。它加快了AI的落地应用,并可能引发中美在AI领域的竞争加剧。AI将渗透到我们生活的每个角落,但同时也可能更加地缘政治化,引发不同的AI形态。

  (注:本文信息基于公开资料整理,未经相关方确认。)

© 版权声明

相关文章