华福证券

AI百科6个月前更新 快创云
51 0

  一、用户规模:全球扩张,下载量激增

  1. 网页端:DeepSeek于24年12月26日推出V3(与GPT4o相媲美),凭借其卓越性能迅速吸引用户增长。随后在1月20日发布的R1(与GPT-o1相当),进一步扩大了其影响力。
  2. APP端:主要针对大众用户,R1的推出使其与GPT-o1并驾齐驱,迅速在海外市场上崭露头角。据点点数据显示,DeepSeek在美国的下载排名从1月22日的201名跃升至1月27日的第一名;而根据七麦数据,截至1月30日,DeepSeek在168个国家稳居下载榜榜首。

  二、DeepSeek的创新策略:架构与精度的双重突破

  1. MOE架构革新:相较于传统MOE专家模型(通常8-16个),DeepSeek每个MoE层包含一个共享专家和256个路由专家,有效减少模型推理时的参数量激活。
  2. MLA架构创新:通过联合压缩键值矩阵为低秩向量,融合多头键值信息,仅需缓存少量低秩向量进行推理,大幅降低了KV缓存需求和内存占用。
  3. 训练特色:敢于打破大模型训练的常规思维(一般使用FP16进行模型权重和梯度计算,FP32进行优化器参数),尝试在低精度FP8模式下训练大模型,并取得良好效果。

  三、DeepSeek的开源影响:推动行业进步与成本降低

  从V3到R1,DeepSeek不仅提升了自身实力,更促进了全行业大模型的进步,加速了向GPT4o和GPT-o1的追赶步伐。同时,成本的降低有助于AI应用和终端的普及,预示着“产品能力竞争”时代的到来,巨头企业的流量优势将更加显著。

  四、DeepSeek对推理成本的影响:用户规模与频次成为关键

  用户规模和使用频次的增加将成为推动推理成本增长的核心因素。据Grok创始人所述,过去60年里,虽然计算成本下降了约1000倍,但由于购买量增加了10万倍,总支出反而增长了100倍。这表明,随着DeepSeek等产品的普及和用户基数的扩大,推理成本将持续上升。

  五、投资建议:看好中国大模型的崛起与国产替代

  在全球AI竞争的背景下,以DeepSeek为代表的中国大模型展现出强劲潜力。特别是AI应用和终端的落地实施,预计将推动AI市场的进一步发展。未来推理成本的显著增长意味着国产替代在算力增长中将扮演核心角色。然而,也需警惕AI竞争的激烈性所带来的挑战。

© 版权声明

相关文章