DeepSeek的高效性能背后,得益于其核心技术优势,包括低精度计算、精简的参数量及优质数据。技术文档揭示,该模型运用数据蒸馏技术生成高质量数据,显著提升训练效率。数据蒸馏通过一系列算法策略,对原始复杂数据进行去噪、降维等处理,从而获取更为精炼、有价值的数据。
当前,DeepSeek R1模型每百万token的查询成本仅为0.14美元,相较于OpenAI的7.5美元,成本降低了98%。这一显著的价格优势,给华尔街算力投资领域带来巨大压力。然而,正当DeepSeek风头正劲之际,其网页/API遭遇不可用状况,目前正调查原因。此前,DeepSeek曾短暂出现闪崩现象,公司回应称可能与服务维护、请求限制等因素有关。
对于同时登顶中美App Store应用榜单的成就,DeepSeek团队深感振奋与感激。他们表示,这一成就不仅是对技术实力的认可,更是全球用户与开发者社区对其信任与支持的体现。团队特别提到了三个核心触动点:技术民主化的胜利、用户信任的支撑以及开放生态的裂变。他们坚信,当技术突破与人文关怀相结合时,冰冷的代码也能展现出温暖的价值。
行业专家对DeepSeek的成就给予高度评价。金沙江创业投资基金主管合伙人朱啸虎认为,DeepSeek的胜利是技术理想主义者的胜利,专注于技术和创新远胜于流量和公关投入。英伟达高级研究科学家Jim Fan表示,DeepSeek-R1可能是首个展示强化学习飞轮效应并带来持续增长的开源软件项目。AI科技初创公司Scale AI创始人亚历山大·王强调,DeepSeek的AI大模型发布可能改变美国与中国在人工智能竞赛中的格局。
DeepSeek的开源模型还引发了一股“复现热潮”。例如,HuggingFace在GitHub上发起的Open R1项目,完全复制并开源了DeepSeek R1,包括训练数据、训练脚本等。面对DeepSeek的挑战,meta也迅速行动,组建多个小组研究其技术细节,并希望在其即将发布的Llama 4中实现技术突破。
然而,DeepSeek的冲击也引发了全球算力市场的动荡。A股寒武纪股价持续走低,日本半导体股也出现下挫,美股纳指期货更是领跌。业内人士认为,DeepSeek可能引发科技股下跌,因为大型科技公司在AI上投入大量资金,但一直存在投资回报能否匹配的问题。分析师指出,中国的DeepSeek可能代表了对美国股市的最大威胁,因为它以极低的价格建立了一个突破性的人工智能模型,且无需依赖最先进的芯片。
尽管如此,DeepSeek的成就仍为业界带来了技术平权与知识信息平权的曙光。正如团队所言,他们正在见证一个新时代的开端——这里没有孤勇的英雄,只有无数双手共同推开未来之门。