体验Deepseek,震撼心灵的AI之旅
今天试用了一下Deepseek,其体验之震撼,简直可以用“无敌”来形容。不用那些老掉牙的论文、转正申请书之类的例子,我以自己的一个创意为例,分享一下Deepseek给我带来的震撼。
半年前,我看穿越小说时,突发奇想,构思了一个叫“完美穿越”的脑洞,并在知乎上提问,但无人问津,未能得到满意的回答,于是这个创意就被搁置了。刚把问题描述原封不动地复制给DeepSeek,它的回答让我大吃一惊。
回答截图如下:
(此处插入多张回答截图)
可以看到,Deepseek不仅完美理解了我的提问,还给出了一份详尽且切实可行的回答。这还是在联网受限的情况下给出的,真是令人惊叹。
为了继续推动开源盛世!
不过,这里有个问题,问这问题的人估计都不懂什么叫量子计算机。一天到晚就知道到处碰瓷。这个问题下面,有一些回答很恶心人。比如有一个回答拿汉芯一号和姜萍来举例,认为DeepSeek是类似的造假行为。而且他还把汉芯和龙芯弄混了。
关于DeepSeek的R1与R1-Zero模型的评价:
首先,DeepSeek作为一个开源软件,可以接受全世界的审视。就算现在OpenAI质疑它蒸馏了数据,要知道作为闭源的OpenAI,也顶多是它的回答可以通过API访问,模型却无法被拷贝。这和有些外行大殖子理解的“站在巨人肩膀上”完全不是一个概念。而且这么蒸馏数据通常是得到一个比较小性能还凑合的模型,而不是现在DeepSeek现在的表现。
另外用汉芯一号或者姜萍来看待DeepSeek是一种愚蠢的刻舟求剑。战报会撒谎,战线不会。哪怕是汉芯一号的纸面数据放在2003年,绝不是什么世界领先水平。现在的大语言模型呢?日本的模型在哪儿呢?韩国的在哪儿呢?欧洲的又在哪儿呢?事实上,在20年后的今天,中国和美国已经是AI这个最热门的高科技领域的唯二玩家。
从做大模型以来,感觉各种实验或小道消息都在透露出一个信号:数据的重要性大于算法。从算法角度来说,r1给我的一个比较厉害的感觉是把rl领域的"code-pretrain"做通了——这里是带引号的"code-pretrain",因为实际上是"reasoning(code/math/logic/…)-pretrain"。
人工智能不参与最终决策,就是个工具。语言类的就是个高效的搜索器,现在的语言类人工智能是用人产生的数据喂出来的,人的素质越高喂出来的越强。工业类的更不用操心了,都是要分门别类的。这种智能产品,不应该所有的东西都串联起来。语言类人工智能没有人不停的制造数据它就停摆了。
今天看到的最新消息是,OpenAI的CEO山姆・奥特曼开始反思了。在Reddit AMA问答中,他表示:“在开源上我们站在了历史的错误一方”。并表示内部正在考虑开源策略,继续研发模型,但OpenAI的领先优势不会像以前那么大了。这不就对了,你再不考虑开源,否则就对不起你的名字OpenAI了。
同学们,基于此,我们真的得感谢DeepSeek的横空出世。记住这个历史性时刻吧:2024年1月31日,当OpenAI举起价格屠刀时开始给免费用户使用时,我们见证了一个时代的转折——算力霸权开始向算法民主低头,闭源高墙第一次被开源铁锤砸出裂缝。这场战争没有输家因为最终受益的永远是站在技术革命浪潮之巅的普通人。对此大家怎么看?欢迎加入我的社群「AIGC・掘金成长研习社」一起掘金、一起暴富、一起用AI赋能!
最后提几点操作层面的建议:对于政府不要再像前几年建设智慧城市的“中台底座”一样再砸大把的钱建设“城市大模型底座”要把钱花在推动各产业大模型化转型上对于有信息中心、具备硬件条件的各类单位尽快抓紧本地化部署一套DeepSeekR1提升工作效率对于上述行业型数字化企业春节后上班第一天就要本地化部署一套R1把技术转化为生产力对于不具备硬件条件的单位对于个人用户鼓励多用DeepSeek的产品帮助他们更好地迭代升级。