为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?
收藏者
0
被浏览
93

5 个回答

Axuanz LV

发表于 前天 07:59

举个例子:如果说豆包是位德智体美劳全面发展的三好学生,DeepSeek则是那个虽然有点偏科,但是那个所偏的科目直接干到了全球大赛冠军的惊人程度。

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-1.jpg

《黑神话·悟空》的冯骥说:DeepSeek是个国运级别的科技成果。
我觉得,他说得并不为过。
随着三大运营商全面接入DeepSeek这款AI平台正在快速渗透到数字基建的毛细血管,并成功打入全球市场。坦白讲,我去年还对DeepSeek、以及深度求索这家公司关注得并不多。而像之前字节跳动推出的豆包,长年占据国内AI软件下载量头把交椅,而DeepSeek那个时候知名度还没有智谱、海螺、KimiChat等AI六小虎的知名度高。
就拿豆包来说,非常努力,啥能力都具备,对话、语音聊天、图片生成、音乐生成、AI搜索、智能体……无所不能,简直就是一个六边形战士,但是DeepSeek-R1一出,却在短时间内一骑绝尘,超过了豆包8倍的下载量。

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-2.jpg

曾经的网红豆包就这样黯淡了下来,不是豆包不被人关注,而是所有的聚光灯都给到了DeepSeek。
DeepSeek能够成功,说明目前美国的科技封锁,对中国是没有用的,反而会激发出更大的创新。
这种创新,同样体现在美国封锁华为5G芯片,最终Mate60 Pro问世,搭载上自研的7nm 5G芯片。
更具象征意义的是,当DeepSeek冲击全球算力格局时,美国商务部正对其开展国家安全调查,试图遏制这个来自东方的AI新贵。
有些美国的AI科学家讽刺DeepSeek并没有创新,用的都是现成的AI技术,我只想说一句,你行你上啊!
当然,DeepSeek的效果在很多方面确实是赶上了GPT-o1的。DeepSeek目前虽然还只专注于文字对话,但是其推理能力已经达到了全球级别的顶尖水平。
“DeepSeek时刻”能够出现的最大意义,我想主要有两点:
一、开源

DeepSeek原本可以选择学习其他公司,把自己最好的模型先闭源,然后开始要人们充值,交会员费。但是他们没有这么做。
OpenAI的傲慢,连曾经的金主爸爸马斯克都看着不爽,OpenAI不Open,高昂的会员费,自以为掌握了最先进的AI大模型,就可以大肆收割。

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-3.jpg

我在设想,DeepSeek的工程师们,在发现他们训练出来的R1版本在各项评分中都赶上了GPT-o1时的那种激动心情。
我在设想,DeepSeek的创始人梁文锋面对自己心爱的作品,到底要不要开源时,有没有犹豫,可能也有片刻犹豫吧,不过马上就做了一个惊天地泣鬼神的决定——“开源”,普惠AI行业。
在分析DeepSeek与豆包的"六边形战士"之争时,我们不难发现技术普惠性和应用落地能力才是决胜关键。
自DeepSeek开源以来,越来越多的企业和开发者开始深入研究其原理并积极学习。许多企业也已经开始部署和应用这一技术。到了3月份,一场激烈的AI人才争夺战已经打响!
看看最近的大厂动态就能明白,Google、百度、阿里、微软等都在致力于打造最接近AIGC的AI应用。例如,字节的扣子智能体已经有千万用户在使用,这些公司在人才招聘方面也是求贤若渴。从2025年的招聘数据来看,AI大模型人才的薪资待遇已经达到50K。
当下,进入AI领域的最佳途径莫过于知乎知学堂的AI大模型免费公开课。课程由专业老师带领,让你从0到1了解AI的底层原理和实际应用。课程内容以DeepSeek的核心算法为切入点,深入解析其底层原理,同时还会教授LLM大模型的训练方法、Prompt Engineering(交互工程),以及如何利用LangChain和Fine-tuning技术为工作和生活赋能。强烈推荐大家体验:
值得一提的是,许多学员在完成课程后,成功训练了自己的AI大模型,这一经验在求职时成为了核心竞争力,助力他们在职场上脱颖而出,特别是在薪资和职业Offer的选择上,可以说是步步高升。
梁文锋在接受采访时表示:
“面对颠覆性技术,封闭只是暂时的。即便是OpenAI的封闭策略,也无法阻止他人赶上。 因此,我们的核心价值在于团队——同事们在这一过程中成长,积累技术知识,形成一个有创新能力的组织和文化,这才是我们的护城河。开源、发表论文,对我们而言实际上没有成本。对于技术人才来说,看到他人跟随自己的创新,会有极大的成就感。事实上,开源更多是一种文化行为,而非商业行为,参与其中能赢得尊重。 对于一家公司而言,这种文化也具有吸引力。”
在问及深度求索这家公司是否会像OpenAI早期开源,后期闭源一样时,梁文峰继续回答:
“我们不会转向封闭。我们认为,首先建立一个强大的技术生态系统比什么都重要。这不仅仅是理想主义,而是符合商业逻辑的。如果模型是商品化的——目前看来确实如此——那么长期的竞争优势来自于更优的成本结构,而DeepSeek正是实现了这一点。这也呼应了中国如何在其他行业取得主导地位的方式。 这种思维方式与大多数美国公司的差异很大,美国公司通常依赖差异化产品来维持更高的利润率。”
这让我想起一句话,你给予得越多,回报也越多。
是的,用开源构建生态,这事美国也不是没成功过,比如Android系统的成功,咋现在就忘了呢?当然也还有记得的,比如Meta开源的Llama也大力促进了AI行业的发展。只是这次,好运站在了DeepSeek这边,站在了中国这边。连顶级域名<a href="http://link.zhihu.com/?target=http%3A//ai.com" class=" external" target="_blank" rel="nofollow noreferrer">http://ai.com都默认转向了DeepSeek,以前,这个殊荣是给ChatGPT的。
你的目标越无私,越具有大爱,越符合道,这个世界会馈赠你更多,因为老天爷认为,把这么多钱财交管给这种人,他放心!
我想,化名为“一只平凡的小猪”捐款1.38亿给慈善机构的梁文锋,也是这种人。
二、大幅降低训练成本


DeepSeek公布的最后训练成本是557.6万美元,这个成本不到GPT-o1的1/10。当然,他们也说了这不是所有的成本,但这并不重要,确实是便宜了很多。

这种成本优势直接动摇了全球算力市场的定价权,DeepSeek冲击全球算力格局的态势已然成型。所以美国各大高科技公司股价会在DeepSeek-R1开源后大跌。

所以特朗普、马斯克、山姆奥特曼、孙正义们都紧张了,因为他们刚刚号称要花5000亿美元建立一个“星际之门”计划,大幅提高AI基础设施投入,让自己的算力优势遥遥领先。

可讽刺的是,这个计划刚公布没几天,DeepSeek就啪啪打脸了,全世界才知道,原来算力也没有想象中那么重要,这么一来,连印度也宣布要大搞AI了,当然,基于咱们的DeepSeek。

因为美国芯片封锁,深度求索买不到最强劲的英伟达H100芯片,退而求其次买了带宽有限的H800,利用有限的算力,极致创新,做出了很多突破式优化。

英伟达的CUDA架构限制了算力的发挥,咱们这些聪明的小伙们就想办法绕开CUDA,用上底层的像汇编语言一样的PTX语言,愣是突破了限制,大幅降低成本。

当然,DeepSeek的创新还有很多,篇幅有限,咱们明天接着详细聊聊DeeepSeek的创新点。

春节档里,电影《哪吒2》也火了,和DeepSeek感觉也是惺惺相惜的。

DeepSeek就像哪吒一样,不畏强权,并对着全世界喊出了:
"若天下无路,我就开出一条路。若天地不容,我便扭转这乾坤”。
三、当豆包还在做"表面美容",DeepSeek已在进行"脑科手术"

如果说豆包的优化是给文章涂脂抹粉,DeepSeek的深度思考则像拿着手术刀做神经接驳——它不仅重构表达,更重塑思维骨架。这种差距在实测对比中如同降维打击:
比如一位用户想做一个“AI视频生成”的视频号,于是问豆包,“做好一个“AI视频生成”视频号的技巧”,得到下面的答案:

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-4.jpg

可以看到,内容比较空泛,也比较模板化,感觉放之四海而皆准,说了很多但是实操性不强。
而同样的问题,问DeepSeek-R1,它上来首先是搜了40篇资料,然后引用9篇,深度思考了38秒,得到如下答案:

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-5.jpg

内容实操性巨强,往哪个垂直领域挖掘、用什么工具、做什么案例以及风险分析,都帮你分析得明明白白,可以直接落地行动了。
你会发现,DeepSeek的深度思考能力真是一流,输出内容的质量高上了很多,再呼应开头,如果说豆包是位德智体全面发展的应届毕业生,DeepSeek就是那位历经风雨,吃过的盐比毕业生的饭还多的老中医,药到病除,专家号一号难求的那种。
当然了,豆包最近还是迎头直上的了,终于也在页面上加入了“深度思考”功能,终于会思考了,内容质量也开始追赶DeepSeek,如下效果。我喜欢这样的良性竞争,不过刚推出的DeepSeek-V3-0324,已经把编程能力强化到了仅次于全球最牛AI编程大模型Claude-3.7,关键还开源,再次轰动。DeepSeek-R2据说也快要推出来了,到时候,还不知道会不会再次惊艳世界呢?我们拭目以待吧~~
相关文章:
吴言不语零一二三:DeepSeek是怎样炼成的?用武侠故事讲透文科生也能看懂的“AI武林秘籍”吴言不语零一二三:DeepSeek开源的DeepEP通信库原来借鉴了诸葛亮的八百里加急驿站系统,神操作让我看跪了
为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-6.jpg

帅冰 LV

发表于 前天 08:12

我下载了三个ai软件来对比,分别是豆包,kim,deepseek,同时问三个软件相同的问题,得出的结论如下:
①豆包,简单问题回答的最快,信息来源大部分来自抖音或者公开的网络信息,基本可以理解为一个精炼的搜索引擎,所以豆包能做到的仅仅是简单的网络公开信息的整合,回答的复杂问题不具备参考性。
②Kim,回答速度比豆包慢,信息来源为全网信息搜索,所以信息比豆包的信息量更大一些,回答问题也更有深度一点,但也一样是既有信息的整合精炼,不具备逻辑思考能力,可以理解为更精确一点的搜索引擎。
对了,还有kim推荐的那个图画生成功能,说是能取代专业美院毕业生,这就有点搞笑了,说实话就它生成的图片画风和画面的艺术性,别说专业美院了,就是去参加美术联考估计都不会及格,所以那些说ai会取代美术生的是小学生审美吧?反正未来会提升到多高的水平不知道,但以kim的绘画水平还差的很远。
③deepseek,问简单问题比如如何做白切鸡,如何清洁地砖上的锈迹。。问这类的问题绝对没有豆包好用,但如果是问复杂的有深度点的问题,它可以甩豆包几条街,完全不在一个水平线,因为它有类似人脑的逻辑思维,可以从不同角度不同层次来分析解答问题。
不过近期deepseek不太好用,基本每天只等回答1-2个问题,应该是要么是现在太热门,全球应用量太大,导致计算能力跟不上,要么就是目前依然被美国的黑客持续攻击着,所以经常宕机,但无论如何只是问了几个问题,就已经能看出来它确实能做到深度求索了。
④对了,后来又下载了阿里旗下的通义,对比下来的感觉是比kim智能一些,但比deepseek还是要差一点。这几天用通义比较多,因为deepseek大部分时间用不了,只能用通义,至少比kim和豆包强一些。
最后再举例说明一下,我问了以上4个软件同样的问题:感染了病毒以后,为什么洗澡会加重症状?
我问这个问题是因为之前感染新冠的时候,网上都在说不要洗澡,但我不信邪啊,我家中央空调室温26度,不存在洗个澡就会受凉的说法,然而我洗一次重一次,洗了两次澡,把本来一点都不严重的新冠感染硬生生的洗的非常严重,以至于用了整整两个月才勉强完全恢复。
这件事一直令我很困惑,查了无数资料看了很多医生专家的说法,没有一个能说清楚原因的,就是没人能说清楚洗澡为什么会加重病情,说的最多的是有可能受凉,但内在逻辑没人知道,且我本人不存在受凉的情况。
这个问题豆包,kim,通义给的答案差不多,通义的内容更多一些,但答案都是网上公开的那几种,没什么新意也不具备科学根据,只有deepseek给出的答案中有一条与众不同,且我认为是唯一正确的答案,大概意思是说洗热水澡时由于温度差,血液和体液会快速流向体表,导致免疫系统建立的免疫屏障被破坏,从而病毒暂时取胜病情加重。
单单只这一条,就让我对deeoseek佩服的五体投地了,因为这条答案之前我查遍全网都没有查到,那么问题来了,这个信息它是从哪里得来的?如果不是既有信息的提炼,那么就只有一种可能了,它已经有了超出人脑的思维能力了。

天狼啸月 LV

发表于 前天 08:24

以下是deepseek和豆包分别以“沁园春”为词牌,写的金庸小说主题的诗。大家可以分别打个分。文末有deepseek和豆包子对两首诗的评分。
deepseek:《沁园春·金庸江湖》
剑气冲霄,侠影横空,谁铸奇峰?看华山论剑,狂歌裂帛;襄阳鏖血,铁马嘶风。塞北乔峰,江南七怪,一掌降龙万壑松。光明顶,有乾坤挪转,烈焰焚穹。
人间尽是豪雄,偏写尽痴嗔爱恨浓。叹白猿腹裂,九阳融雪;绝情谷冷,断臂雕龙。鹿鼎藏奸,连城埋玉,笑傲江湖曲未终。浮槎去,剩碧涛深处,侠骨留踪。
豆包:《沁园春·金庸江湖》
侠影江湖,笔绘乾坤,墨染情仇。看华山论剑,群雄逐鹿;神雕侠侣,侠侣情柔。大漠孤烟,襄阳烽火,侠义昭昭护九州。刀光闪,听金戈铁马,岁月长流。
江湖故事悠悠。多少梦、书中一并收。叹萧峰豪迈,义薄云天;郭靖守土,热血盈眸。芷若情深,无忌义重,恩怨情仇意难休。抬望眼,品金庸笔下,千古风流 。

豆包给两首诗的评分分别是:86和82
deepseek给两首诗的评分:92和85

再来两首deepseek的写的三体的:
《沁园春·黑暗森林》
星海沉渊,万籁噤声,光锥锁疆。  看田园倾覆,霓虹碎烬;歌者抛箔,寰宇平章。  猜链横空,熵钟倒卷,蝼蚁仓皇叩大荒。  抬望眼,问藏弓谁执?弓挽天狼。
曾痴善恶虚妄,笑稚子燃灯照虎狼。  叹面壁焚计,孤舟破雾;执剑凝眸,只手悬霜。  人性燎原,兽锋裂帛,血色星尘溅八荒。 碑文锈,纵星焚万界,炬照苍茫!  
《水调歌头·黑暗森林》  
蝼蚁窥天幕,振翅即招弓。  藏形匿迹如芥,犹恐露鳞鸿。  一念星河裂变,刹那千帆蔽日,火雨噬苍穹。  猜链锁重劫,沉默是兵戎。
面壁计,持剑令,判枯荣。  沙中鱼跃,幽瞳深处启迷蒙。  曲迹流亡星野,残舰独航熵海,归路已冰封。  碑上文明字,半是烬尘红。  莫问谁开刃,宇宙本盲聋。

tdsyj LV

发表于 前天 08:33

答案很简单:DeepSeek用“开源+技术革命”打了一场降维打击,而豆包困在了“性价比”的舒适区里。
2025年春节期间,AI圈上演了一场冰火两重天的戏码:一家中国公司DeepSeek横空出世,仅用20天日活就突破2000万,横扫157个国家的应用市场,甚至让英伟达股价单日暴跌17%;
而背靠字节跳动的豆包,坐拥近6000万月活用户,但在国际化拓展方面仍有提升空间,,技术领域的声量也相对更侧重于国内市场。看似功能相近的两款AI产品,为何命运截然不同?

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-1.jpg

其实这背后是一场关于技术路线、市场策略和时代机遇的深层博弈。
开放程度:开源VS闭源
Deepseek通过开源代码和模型,构建了一个面向全球的开放生态系统。
当Open AI的ChatGPT Pro每月收费200美元时,DeepSeek直接开源了性能相当的R1模型,推理API定价仅为Open AI的1/30。更狠的是,它用600万美元的训练成本,跑出了Meta耗资6000万美元的Llama3-405B的效果。
这种“掀桌子”式的开源策略,瞬间点燃了全球开发者的热情。硅谷工程师连夜下载代码调试,华尔街投行用Deepseek搭建金融分析工具,甚至中东的医疗团队都开始用它辅助诊断。

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-2.jpg

开源,不仅仅是一种姿态,更是一种战略武器。正如一句名言所说:“给我一个支点,我就能撬动地球”,Deepseek的开源,就如同给全球开发者提供了一个强大的支点,让他们能够站在巨人的肩膀上,构建出无数的应用生态。
反观豆包,虽然字节跳动为其整合了抖音、今日头条、番茄小说的流量入口,可以日生成3000万张图片、处理1200亿Tokens文本,但闭源模式让它始终是“字节系生态的附庸”。普通用户用豆包聊天、P图,开发者却无法基于它二次创新。当Deepseek用开源生态绑定全球开发者时,豆包只能在国内市场通过价格战来内卷
市场策略:闪电战VS持久战
Deepseek的崛起,堪称一场教科书级的闪电战,有当年OpenAI一夜爆红的趋势了。
它精准抓住了三个关键时机:
春节流量红利:趁用户居家娱乐需求暴涨时上线,日活迅速突破1500万;
全球开发者空虚期:当时OpenAI正陷入版权诉讼,Meta的Llama3尚未发布,Deepseek用开源填补了市场空白;
全球竞争环境下:Deepseek以技术实力打破了某些关于中国AI模型质量的疑虑,树立了国际市场对中国AI的信心。
Deepseek的市场策略,可以用“快、准、狠”三个字来概括。这种“闪电战”式的打法,迅速打开了全球市场,也为后续的品牌塑造和生态构建,赢得了宝贵的时间窗口,我们节后复工,被咨询最多的就是DeepSeek部署与应用。
反观豆包,虽然背靠字节跳动的流量帝国(抖音、飞书、番茄小说全面导流),但国际化步伐迟缓。其海外版CiCe和Coze,用户数为1226万。
更尴尬的是,当Deepseek在157个国家登顶下载榜时,豆包仍依赖“烧钱换市场”的传统打法——比如在抖音上推AI生成的表情包。豆包的市场策略,更像是一场“持久战”,稳扎稳打,步步为营。但这在瞬息万变的AI战场上,可能会错失良机
两者的差距,本质上是对技术品牌的理解差异:Deepseek用开源建立生态,而豆包仍在用互联网产品的思维做AI——重运营、轻壁垒,最终可能会陷入有用户无口碑的窘境。
在技术驱动的AI领域,品牌的核心是技术实力。Deepseek深谙此道,将技术创新作为品牌建设的基石,而豆包似乎仍停留在流量运营的旧思维中。当前大模型技术竞争已进入深水区,行业格局正从单一技术突破转向系统性生态建设。随着企业AI化进程加速,市场对具备大模型开发能力、理解AI开源生态的技术人才需求激增。
这正是开发者突破表层应用、深入技术底层的关键时机。
面对这场技术浪潮,与其被动观望不如主动破局。掌握大模型核心开发能力,同时解锁DeepSeek同款MLA架构解析、MoE模型调优技巧,是当下 AI 人才急需的技能点。
给大家推荐一个 AI 大模型公开课,课程内容很系统,圈内大佬循序渐进地讲解 DeepSeek 等大模型的原理、应用开发及模型训练全流程。相较于独自研究,跟随指导学习无疑是更高效的路径。现在参与,即可免费获取课程机会,不妨先了解一下,为技术进阶储备实力。

课程着眼于实用技能的掌握,帮助大家掌握扎实的AI技术基础,从容应对未来技术变革,在AI浪潮中行稳致远。
技术标签:颠覆性创新VS微迭代优化

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-3.jpg

Deepseek敢喊出“用1%算力复现GPT-5”,豆包却只能强调“千tokens低至3厘”。
两者的技术定位也不相同。Deepseek的R1模型专攻多步骤逻辑推理,比如解微积分、分析财报、推导药物分子结构,甚至能输出带因果链的推导过程。这种能力得益于两项核心技术:
多头潜在注意力(MLA):让模型像人类一样“分步骤思考”,而非机械式输出答案。
专家混合架构(MoE):用多个子模型协同作战,既降低算力消耗,又提升复杂任务的表现。
相比之下,豆包更像一个“六边形战士”——聊天、作图、写文案样样能行,但样样不精。它依赖预设规则和多模态交互(比如图文生成),但在需要深度推理的场景中,表现甚至不如一些垂直类AI工具。
用业内人士的话说:“豆包是高级搜索+文档排列,DeepSeek是真正的类人推理。”
豆包的技术路线,更像是对现有技术的微迭代优化,在应用层面做加法,而非在底层技术上实现突破。
更关键的是,DeepSeek的技术突破直接踩中了资本市场的G点。当它宣布“1%算力复现GPT-5”时,英伟达股价应声暴跌;而豆包的“性价比”标签,却始终困在“省电模式”的叙事里,难以引发质变。
资本永远追逐颠覆性创新,而非性价比。这也注定了DeepSeek在全球范围内更容易获得更高的关注度和认可。
启示录:AI2.0时代,什么才是真正的护城河?
Deepseek与豆包的对决,揭示了一个残酷的真相:在AI2.0时代,性价比和流量不再是王道,颠覆性技术+开源生态才是核武器。
OpenAI用ChatGPT系列定义了AI1.0的规则,而Deepseek用开源模型改写了游戏——它证明,即使算力被卡脖子,也能通过算法创新和生态协同实现超车。反观豆包,尽管有字节跳动的加持,却困在应用层内卷的陷阱中,始终未能触及技术的深水区。
AI1.0时代,比拼的是“算力+数据+资本”,巨头凭借雄厚的资源优势,构筑了强大的护城河;而AI2.0时代,“技术创新+开源生态”将成为新的游戏规则
未来的AI巨头,一定是技术极客与生态建设者的合体在AI的世界里,“颠覆”才是永恒的主题。
Deepseek的横空出世,预示着AI的“新纪元”已经到来。在这个大模型驱动一切的时代,谁掌握了颠覆性技术,谁构建了开放繁荣的生态,谁就将主宰未来

ues6858 LV

发表于 前天 08:44

二者不一样哈,差远了,不是同一类大模型
字节的豆包是普通大模型
deepseek R1 是推理大模型
这意味着
核心目标不一样

豆包:文本生成、基础问答、信息检索
DS:多步骤逻辑推理、复杂问题解决、因果分析
训练数据不一样

豆包:通用语料(网页、书籍、对话等)
DS:增加逻辑题、数学题、科学推理等结构化数据
训练方法不一样

豆包:自回归语言建模
DS:结合思维链(CoT)、程序辅助、符号逻辑增强
输出特点不一样

豆包:流畅但可能缺乏深度逻辑
DS:结构化、分步骤、注重因果链推导
所以,豆包和deepseekR1压根儿没有可比性
举个例子你可能就明白了

鸡兔同笼问题

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-1.jpg


为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-2.jpg

从鸡兔同笼问题的回答我们可以看出,虽然结果一样,但,deepseek的思维链展示更加清晰完整。
如果你还不能理解deepseek的伟大,那我再给你举一个语料库被污染的典型例子

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-3.jpg

看,你们吹嘘好用的豆包,成傻子了吧!

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-4.jpg

看,这就是deepseek的牛逼之处,就算语料库被污染了,她也能通过自己的思考得出正确的答案。
来和高手学习一下

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-5.jpg

感谢 @野火吃腰果 提供的调试思路
再看一个比大小的问题R1表现如下

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-6.jpg

关于字母统计的问题,我们看看豆包怎么说
第一步,让豆包承认传统生成式大模型存在缺陷

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-7.jpg

好,豆包投降了,我们趁热打铁,问问豆包,传统生成式大模型还有哪些缺陷,应如何克服

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-8.jpg

好,这是豆包告诉我们的真相,我们不能只相信一面之词,还要问问deepseek,看看这个火出圈的家伙怎么说
关于英文字母统计的问题


为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-9.jpg

ds很开明,不仅把原因公布了出来,还把如何解决公布了出来,就这一点ds就可以吊打世上大多数生成式ai了!
作为普通人,我们只能通过提高自己的提示词编写技术,来让ai输出更加精准的答案,比如ds给出的改进建议:清逐个字母统计分析
关于生成式大模型的缺陷问题


为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-10.jpg

以豆包为首的普通生成式大模型,你们好好学学吧,自己有问题不敢直接面对,怎么进步,还得让竞争对手拿鞭子抽?AI工程师们,加油努力吧,方法都有了,就看你们怎么改进了
别光说别人不好,我们看看DS在这些缺陷上的进展现状


为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-11.jpg

这还不够,你敢承认自己不行吗?



厉害了,不仅承认了自己的不足,还给出了,例子,原因,和用户应对建议!我就喜欢这样的AI,开诚布公的让我知道AI得不足,我就可以有的放矢的提升自己的专项技能,让AI变得更好,但,豆包这类传统生成式大模型总是藏着,掖着,生怕用户知道它的不足,你连自己的弱点都不敢面对,你咋进步呀!
通过这一系列得沟通,我学到了很多新知识,有一些还没有完全学通透,还需要与ds进行更加深入的沟通,探讨,验证…
加油,deepseek,相信你会变得更好,在你的加持下,我会变得更优秀

deepseek+豆包使用实例

讲道理 我为什么觉得豆包比deepseek还好用? 关于深度思考与联网搜索的使用

@不宅不舒服斯基 问联网搜索和深度思考两个按钮什么时候开,什么时候关,如何配合使用,嗯,这应该是第一次使用AI时,最重要的问题,因为你只有了解了AI的特性,才能更好的发挥AI的作用,看看DS怎么回答

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-13.jpg

更多深入探讨与应用技巧清移步
DeepSeek深度思考与联网搜索使用指南

夕遥 LV

发表于 昨天 03:12

DeepSeek之所以能引起全球关注,是因为其在某些特定领域或任务上表现出了卓越的性能和先进性。这背后可能涉及几个关键因素:<br><br>首先,DeepSeek在技术上的创新和突破使其在某些复杂任务中表现出色,得到了业内专家和用户的广泛认可。其次,DeepSeek的品牌宣传策略、团队的专业背景和研发实力等都可能为其赢得了良好的口碑和影响力。此外,市场对于新技术的应用和发展前景的期待也可能为其成功带来了助推力。相比之下,其他类似功能的国产大模型可能在某一方面的表现未足以吸引市场的注意。另外,品牌知名度、市场推广策略等也可能是影响其关注度的重要原因。总的来说,多个因素的综合作用导致了不同产品的关注度差异。

chenyumai LV

发表于 昨天 03:24

DeepSeek之所以能引起全球关注,是因为其在某些关键技术上取得了显著突破和创新。可能的原因包括其先进的算法、强大的性能、精确的应用场景识别等。此外,DeepSeek背后的团队在宣传和市场推广方面也做得非常出色,有效地将产品推广给大众。至于其他国产大模型未能获得足够的关注,可能是由于其创新程度、性能表现、应用场景等方面相对较为平凡,或者在市场推广方面没有做到足够有效的宣传。不过,每个大模型都有其独特之处,只是关注点和应用领域不同而已。建议进一步了解和研究每个大模型的特色和优势,以做出更为全面的评价。

aylue LV

发表于 昨天 03:36

针对您提到的关于DeepSeek与其他国产大模型之间的差异,其原因可能如下:<br><br>DeepSeek可能具有某些独特的技术特点或创新,使其在特定领域或任务上表现出卓越的性能,从而引起了广泛的关注。此外,DeepSeek的推广和市场营销策略可能更为成功,使其在社交媒体、行业会议和学术期刊等渠道得到了更多的曝光。此外,一个模型的成功也受到其背后团队或公司的声誉、资金支持和合作伙伴的影响。而其他的国产大模型可能因为各种原因尚未引起广泛关注,但这并不代表它们没有价值或潜力。每个模型都有其特点和优势,只是需要更多的宣传和推广。希望以上内容对您有帮助。

您需要登录后才可以回帖 登录 | 立即注册