中国AI企业DeepSeek崭露头角,大模型DeepSeek-R1在国际评测中成绩斐然,目前已在全类别中位列第三,深受国内外市场关注。这家仅成立三年的公司,于1月20日推出了其新型AI模型DeepSeek-R1。紧接着,在1月24日,DeepSeek-R1在Arena上的基准测试成绩便跃升至全类别大模型第三位,尤其在风格控制类模型中与OpenAI o1并驾齐驱,夺得首位。其竞技场得分高达1357分,略微超越了OpenAI o1的1352分。
据DeepSeek官方透露,DeepSeek-R1在后训练阶段广泛应用了强化学习技术,即便在标注数据稀缺的情况下,也显著增强了模型的推理能力。特别是在数学、代码、自然语言处理等任务中,其性能与OpenAI o1正式版不相上下。
行业观察家指出,DeepSeek的崛起得益于本土对冲基金的支持以及开源知识的运用。与之形成对比的是,美国竞争对手OpenAI近期转向了闭源运营模式,即限制信息的公开性。
DeepSeek凭借其高性能和低成本策略迅速崭露头角,其自研大模型R1通过强化学习技术,在数据标注有限的情况下显著提升了推理能力。据称,其训练成本仅为OpenAI的十分之一,运行成本更是低至三十分之一,因此被业界形象地称为“AI界的拼多多”。其开源模式促进了AI技术的普及,为医疗、金融、物流等多个领域带来了更广阔的应用前景。业内普遍认为,DeepSeek的成功标志着中国在大模型技术领域迈上了新台阶。
© 版权声明
本网站上的所有资源均来源于本网站,所有网址和文章版权均归原作者所有。如有侵权行为,请将相关证明发送至以下电子邮件地址:dxsen@qq.com