举个例子:如果说豆包是位德智体美劳全面发展的三好学生,DeepSeek则是那个虽然有点偏科,但是那个所偏的科目直接干到了全球大赛冠军的惊人程度。
《黑神话·悟空》的冯骥说:DeepSeek是个国运级别的科技成果。
我觉得,他说得并不为过。
随着三大运营商全面接入DeepSeek这款AI平台正在快速渗透到数字基建的毛细血管,并成功打入全球市场。坦白讲,我去年还对DeepSeek、以及深度求索这家公司关注得并不多。而像之前字节跳动推出的豆包,长年占据国内AI软件下载量头把交椅,而DeepSeek那个时候知名度还没有智谱、海螺、KimiChat等AI六小虎的知名度高。
就拿豆包来说,非常努力,啥能力都具备,对话、语音聊天、图片生成、音乐生成、AI搜索、智能体……无所不能,简直就是一个六边形战士,但是DeepSeek-R1一出,却在短时间内一骑绝尘,超过了豆包8倍的下载量。
曾经的网红豆包就这样黯淡了下来,不是豆包不被人关注,而是所有的聚光灯都给到了DeepSeek。
DeepSeek能够成功,说明目前美国的科技封锁,对中国是没有用的,反而会激发出更大的创新。
这种创新,同样体现在美国封锁华为5G芯片,最终Mate60 Pro问世,搭载上自研的7nm 5G芯片。
更具象征意义的是,当DeepSeek冲击全球算力格局时,美国商务部正对其开展国家安全调查,试图遏制这个来自东方的AI新贵。
有些美国的AI科学家讽刺DeepSeek并没有创新,用的都是现成的AI技术,我只想说一句,你行你上啊!
当然,DeepSeek的效果在很多方面确实是赶上了GPT-o1的。DeepSeek目前虽然还只专注于文字对话,但是其推理能力已经达到了全球级别的顶尖水平。
“DeepSeek时刻”能够出现的最大意义,我想主要有两点:
一、开源
DeepSeek原本可以选择学习其他公司,把自己最好的模型先闭源,然后开始要人们充值,交会员费。但是他们没有这么做。
OpenAI的傲慢,连曾经的金主爸爸马斯克都看着不爽,OpenAI不Open,高昂的会员费,自以为掌握了最先进的AI大模型,就可以大肆收割。
我在设想,DeepSeek的工程师们,在发现他们训练出来的R1版本在各项评分中都赶上了GPT-o1时的那种激动心情。
我在设想,DeepSeek的创始人梁文锋面对自己心爱的作品,到底要不要开源时,有没有犹豫,可能也有片刻犹豫吧,不过马上就做了一个惊天地泣鬼神的决定——“开源”,普惠AI行业。
在分析DeepSeek与豆包的"六边形战士"之争时,我们不难发现技术普惠性和应用落地能力才是决胜关键。
自DeepSeek开源以来,越来越多的企业和开发者开始深入研究其原理并积极学习。许多企业也已经开始部署和应用这一技术。到了3月份,一场激烈的AI人才争夺战已经打响!
看看最近的大厂动态就能明白,Google、百度、阿里、微软等都在致力于打造最接近AIGC的AI应用。例如,字节的扣子智能体已经有千万用户在使用,这些公司在人才招聘方面也是求贤若渴。从2025年的招聘数据来看,AI大模型人才的薪资待遇已经达到50K。
当下,进入AI领域的最佳途径莫过于知乎知学堂的AI大模型免费公开课。课程由专业老师带领,让你从0到1了解AI的底层原理和实际应用。课程内容以DeepSeek的核心算法为切入点,深入解析其底层原理,同时还会教授LLM大模型的训练方法、Prompt Engineering(交互工程),以及如何利用LangChain和Fine-tuning技术为工作和生活赋能。强烈推荐大家体验:
值得一提的是,许多学员在完成课程后,成功训练了自己的AI大模型,这一经验在求职时成为了核心竞争力,助力他们在职场上脱颖而出,特别是在薪资和职业Offer的选择上,可以说是步步高升。
梁文锋在接受采访时表示:“面对颠覆性技术,封闭只是暂时的。即便是OpenAI的封闭策略,也无法阻止他人赶上。 因此,我们的核心价值在于团队——同事们在这一过程中成长,积累技术知识,形成一个有创新能力的组织和文化,这才是我们的护城河。开源、发表论文,对我们而言实际上没有成本。对于技术人才来说,看到他人跟随自己的创新,会有极大的成就感。事实上,开源更多是一种文化行为,而非商业行为,参与其中能赢得尊重。 对于一家公司而言,这种文化也具有吸引力。” 在问及深度求索这家公司是否会像OpenAI早期开源,后期闭源一样时,梁文峰继续回答:“我们不会转向封闭。我们认为,首先建立一个强大的技术生态系统比什么都重要。这不仅仅是理想主义,而是符合商业逻辑的。如果模型是商品化的——目前看来确实如此——那么长期的竞争优势来自于更优的成本结构,而DeepSeek正是实现了这一点。这也呼应了中国如何在其他行业取得主导地位的方式。 这种思维方式与大多数美国公司的差异很大,美国公司通常依赖差异化产品来维持更高的利润率。” 这让我想起一句话,你给予得越多,回报也越多。
是的,用开源构建生态,这事美国也不是没成功过,比如Android系统的成功,咋现在就忘了呢?当然也还有记得的,比如Meta开源的Llama也大力促进了AI行业的发展。只是这次,好运站在了DeepSeek这边,站在了中国这边。连顶级域名<a href="http://link.zhihu.com/?target=http%3A//ai.com" class=" external" target="_blank" rel="nofollow noreferrer">http://ai.com都默认转向了DeepSeek,以前,这个殊荣是给ChatGPT的。
你的目标越无私,越具有大爱,越符合道,这个世界会馈赠你更多,因为老天爷认为,把这么多钱财交管给这种人,他放心!
我想,化名为“一只平凡的小猪”捐款1.38亿给慈善机构的梁文锋,也是这种人。
二、大幅降低训练成本
DeepSeek公布的最后训练成本是557.6万美元,这个成本不到GPT-o1的1/10。当然,他们也说了这不是所有的成本,但这并不重要,确实是便宜了很多。
这种成本优势直接动摇了全球算力市场的定价权,DeepSeek冲击全球算力格局的态势已然成型。所以美国各大高科技公司股价会在DeepSeek-R1开源后大跌。
所以特朗普、马斯克、山姆奥特曼、孙正义们都紧张了,因为他们刚刚号称要花5000亿美元建立一个“星际之门”计划,大幅提高AI基础设施投入,让自己的算力优势遥遥领先。
可讽刺的是,这个计划刚公布没几天,DeepSeek就啪啪打脸了,全世界才知道,原来算力也没有想象中那么重要,这么一来,连印度也宣布要大搞AI了,当然,基于咱们的DeepSeek。
因为美国芯片封锁,深度求索买不到最强劲的英伟达H100芯片,退而求其次买了带宽有限的H800,利用有限的算力,极致创新,做出了很多突破式优化。
英伟达的CUDA架构限制了算力的发挥,咱们这些聪明的小伙们就想办法绕开CUDA,用上底层的像汇编语言一样的PTX语言,愣是突破了限制,大幅降低成本。
当然,DeepSeek的创新还有很多,篇幅有限,咱们明天接着详细聊聊DeeepSeek的创新点。
春节档里,电影《哪吒2》也火了,和DeepSeek感觉也是惺惺相惜的。
DeepSeek就像哪吒一样,不畏强权,并对着全世界喊出了:&#34;若天下无路,我就开出一条路。若天地不容,我便扭转这乾坤”。 三、当豆包还在做&#34;表面美容&#34;,DeepSeek已在进行&#34;脑科手术&#34;
如果说豆包的优化是给文章涂脂抹粉,DeepSeek的深度思考则像拿着手术刀做神经接驳——它不仅重构表达,更重塑思维骨架。这种差距在实测对比中如同降维打击:
比如一位用户想做一个“AI视频生成”的视频号,于是问豆包,“做好一个“AI视频生成”视频号的技巧”,得到下面的答案:
可以看到,内容比较空泛,也比较模板化,感觉放之四海而皆准,说了很多但是实操性不强。
而同样的问题,问DeepSeek-R1,它上来首先是搜了40篇资料,然后引用9篇,深度思考了38秒,得到如下答案:
内容实操性巨强,往哪个垂直领域挖掘、用什么工具、做什么案例以及风险分析,都帮你分析得明明白白,可以直接落地行动了。
你会发现,DeepSeek的深度思考能力真是一流,输出内容的质量高上了很多,再呼应开头,如果说豆包是位德智体全面发展的应届毕业生,DeepSeek就是那位历经风雨,吃过的盐比毕业生的饭还多的老中医,药到病除,专家号一号难求的那种。
当然了,豆包最近还是迎头直上的了,终于也在页面上加入了“深度思考”功能,终于会思考了,内容质量也开始追赶DeepSeek,如下效果。我喜欢这样的良性竞争,不过刚推出的DeepSeek-V3-0324,已经把编程能力强化到了仅次于全球最牛AI编程大模型Claude-3.7,关键还开源,再次轰动。DeepSeek-R2据说也快要推出来了,到时候,还不知道会不会再次惊艳世界呢?我们拭目以待吧~~
相关文章:
吴言不语零一二三:DeepSeek是怎样炼成的?用武侠故事讲透文科生也能看懂的“AI武林秘籍”吴言不语零一二三:DeepSeek开源的DeepEP通信库原来借鉴了诸葛亮的八百里加急驿站系统,神操作让我看跪了
|
|