DeepSeek深度求索公司能率先突破AGI吗？

世界各国人工智能公司在AGI这个领域竞争很激烈，因为通用人工智能的实现将让整个国家甚至整个世界发生惊天动地的变化，哪个国家先掌握了通用人工智能哪个国家就等于掌握了通往下一个文明的钥匙，我敢说先掌握通用人工智能的国家就等同于掌握了降维打击的强大武器，而且一旦掌握必然垄断技术生态成为该领域的唯一霸主。我说这些只是希望中国能首先实现不说主导世界秩序至少别让美国先实现用来打压中国就完了。

发表于 2025-4-22 18:48:07

目前有一种可能，AGI这个方向可能就不对，应该更向专家化、精益化方向发展，而不是一味求大求全。
deepseek整出来的模型实际可以理解为一个问题理解模块链接着很多个针对性的专家模块，回答你问题时只会调用对应专家模块，从而避免不相关信息干扰。原则上对于特定需求，一个小巧的专业模型可能效果会更好，而且更容易部署使用。

发表于 2025-4-22 18:56:29

DeepSeek能不能率先突破AGI？这事啊，说实话天天都在盯着这些模型，光看片面宣传资料没啥意义，得看几个关键点。
一、AGI不是堆参数、烧钱竞赛，关键是架构创新

现在这些大模型搞得像“拼多多军备竞赛”，谁GPU多谁就牛逼。
你看OpenAI搞GPT-4，用的是Mixture of Experts（MoE），搞了一堆路由专家网络，参数炸裂的同时推理成本也被控住了。但DeepSeek干嘛了？
照着GPT-4开了个架，做了个DeepSeek-VL，视觉+文本整合，确实能看出来他们有点子东西，但说真的，这还没摸到AGI的门槛。
AGI不只是把语言、图像、代码堆一起，整合的核心是跨模态理解和自主推理能力。
这玩意不是靠训练100TB数据就能学出来的。架构得换个思路，现在Transformer架构到头了已经，拼谁的参数多、谁调得准没啥出路了，得搞异构计算、记忆增强、元学习、Agent交互系统这些新东西。
DeepSeek目前就是打磨工程、训练范式和数据，暂时还看不到“范式转移”的苗头。
二、模型只是“胚子”，生态系统才是真功夫

AGI不是光靠大模型一个引擎，它是一整套系统：

模型：会“看”“说”“写”“想”
工具调用能力：能调用API、搜索、执行命令
Agent系统：能记忆、反思、规划、学习
调度系统：能组织多个Agent协作完成复杂任务
长期记忆和世界模型：能形成知识积累和预测能力

你看OpenAI为啥牛？
不是GPT-4多强，而是他们在搞AutoGPT、GPT Agents、插件、API接入、Code Interpreter这些全栈能力。微软那边一边接OpenAI一边自己搞Phi-2、小模型微调，还有整合Office 365、Copilot大生态，套的是“AI操作系统”的路数。
DeepSeek现在的路径更多还是停留在“模型即产品”的阶段。AGI不是产品，它是平台，是整个知识-能力-交互系统。DeepSeek想跑赢，就得先把系统思维拉起来，不然到头来就是做了个“更便宜的GPT”，没啥壁垒。
三、数据、安全和推理能力，是DeepSeek的三道坎

数据问题
国内训练数据一直受限，一方面是高质量中英文数据匮乏，另一方面是版权问题、合规问题、语言风格不统一，搞多了还容易“思想偏航”。DeepSeek再牛也得受制于数据可用性。要解决这个问题，不是爬更多网页就能搞定的，要有自己构建“知识图谱+任务式数据生成”能力，比如搞大规模模拟环境、生成式任务数据、反事实推理数据。
推理能力
AGI最难的地方是推理，而不是表达。推理能力目前是大模型最拉胯的短板，逻辑跳跃、递归判断、多步规划基本靠运气。DeepSeek要突破AGI，得在“思维链”（Chain of Thought）、“工具调用+反馈学习”这块下重注。开源的大模型在这块经常掉链子，得靠思维增强模块来弥补。
安全与对齐
AGI不是聪明人，它是疯狂的魔法学徒。要让它靠谱，不能光靠SFT（监督微调）和RLHF（人类反馈强化），得上多模态道德审查、价值对齐、多层级安全边界。DeepSeek目前这方面的披露非常少，光靠“国产替代”这口号是扛不住AGI军备竞赛的。

四、人才和算力，也别幻想“弯道超车”

AGI这种玩意，真不是“程序员头秃一点、熬夜多一点”就能搞出来的。这事本质上是国家级战略对抗。OpenAI背后是微软、NVIDIA、美国国家实验室一票科学家+全栈算力配套。DeepSeek这帮人能力肯定不差，但你得看到体量差距：

美国搞AGI，不是某家公司在搞，是整个国家战略布局
中国现在还在AI寒冬边缘游走，芯片被卡脖子、投融资趋冷、人才流失严重

DeepSeek在国内已经算“中流砥柱”，但是就这水平，你想让它先一步干掉OpenAI、Anthropic、Google DeepMind，难度跟“让一个县城中学考生拿全国高考第一”差不多。
五、DeepSeek的优势在哪？别全盘否定

说了这么多，不是喷DeepSeek不行，反而我觉得它是目前国内为数不多“看起来像真AI公司”的玩家。他们至少：

懂得模型训练的核心壁垒，不是照搬GPT架构这么简单
有能力搞全模态模型，不是PPT里吹牛逼那种“多模态”
工程实现比较务实，响应速度、部署能力在国内属于第一梯队

他们最大潜力是在Agent体系和本地部署适配。如果国家给政策、资本敢下注、芯片问题能缓一口气，他们有机会成为“非美体系下的主力选手”。
<hr/>总结一下：DeepSeek现在离AGI还有一段距离，但不是没希望

你要问我DeepSeek能不能搞出AGI？我只能说：

从技术路径上没看到范式革命，从生态系统上还没走到操作系统层级，从国家级资源来看依然缺支援。

但是，他们是目前国内最有希望的选手之一。想赢，就得拿出点“不按套路出牌”的狠活。像OpenAI当年一样，不怕失败、不怕重构、不怕走错路。
AGI这东西不是一步到位的神话，它是亿万个试错和重构后的奇点。
DeepSeek要想赢，就得敢干、敢赌、敢打破自己现在这一套舒服的范式。否则，最多就是GPT-4的“中国平替”——离统治AI文明还差个时代的距离。
<hr/>
你知道AI如何帮助你提高工作效率吗？

在人工智能飞速发展的今天，掌握实用的AI技能已经不再是科技从业者的专利！
无论你是内容创作者、程序员，还是学生，AI资料包都能助你一臂之力！
整理了一份独家AI资料包包含了77份AI提示词、68篇实用指令以及超全的视频教程。
全部打包下载，助你快速掌握AI工具，提升创作、工作效率，甚至可以让你在短时间内实现从小白到进阶用户的蜕变！
已经整理成8000多页，2025最新AI资料合集（史上最全）
限时免费领取！ 想要成为AI应用高手，赶紧点击查看详情，立即获取！⚡️

发表于 2025-4-22 19:05:15

不能。
不论是名声冠绝的GPT还是名声大噪的DeepSeek，都是静态的离身智能，而AGI必然是有具身智能的。
也就是说，搞人工智能的公司，必须要有机器人，要搞实体产业，要在机器人身上搞机器自学习、实时反馈和实时控制以及实时PLC。
我在之前的回答里看好宇树，不是因为宇树的产品做到了低价、做到了很多机器人领域的顶尖，而是他在机器人的关节电机、传感器上做的大量创新，这些基础零件才是机器人迈向具身智能的基础（这也是他低价的关键），他自家的机器人的关节电机及传感器都是他们自家研产的，国内很多机器人厂家还得找他们买电机。
离身智能是低水平智能的高水平智能假象，不做到具身智能，离身智能是不能迈向AGI的。受鄙人粗浅的认识，只要深度求索不买机器人进实验室研究，那开发出AGI的就不会是他们，哪怕第一个开发出AGI的公司是别的公司套用他们家的DeepSeek........这都是有可能的。

发表于 2025-4-22 19:16:42

首选短期内全球不太可能实现通用人工智能。我本人就是这个领域的从业者，大语言模型的底层框架技术也比较了解，包括deepseek做了哪些优化也清楚，但这个优化方向是完全实现不了AGI的。
AGI是通用人工智能，用通俗点的话说就是这个AI像人一样，不需要大的算力训练，你和他直接语言交流，他就能快速学习并解决各种场景问题。实际情况是大语言模型技术包括deepseek目前商业化落地需要大量的定制化开发，几乎90%的成本都是定制化开发，这和AGI相去甚远，差不止一代产品，甚至目前基于超大参数量的范式很可能就无法突破到AGI，这才是最大的问题。
当前我们在基于deepseek打造应用的时候需要做哪些事情？
1.意图的定义。不做意图定义，deepseek意图识别准确率低于80%，幻觉超过8%，这些都是有机构评测的，这种指标怎么解决场景化问题？如何提升准确率，减少幻觉？这只能是case by case的去场景化定制控制。
2.算力问题。大量的场景需要超低时延，超低时延又对应大量的算力。deepseek自身的幻觉问题和能力边界问题很严重，训练行业垂直模型又非常费钱，这就导致大语言模型落地成本很高，短期内很难大规模取代传统的软件产品。
3.技术瓶颈问题。参数量持续扩大会不会最终导致模型能力退化？这个几乎是一定的，现在这套范式已经被验证不太可能通往AGI，但是商业变现目前看是可能的。
还有其他方式么？其实是有的1.提升小参数量模型的迁移学习能力，这个范式之前有人走的，只是被LLM淹没了 2.类脑神经网络。这条路现在也有人在研究，可能也会突破。3.类脑芯片。软硬件一起突破，这条路可能概率比现在的LLM更大。
总之现在谈论AGI还早，10年内完全不可能，10年后到时再看，AGI到来之前一定会有大量的打工人被替代，这些问题才是当下要考虑的。

发表于 2025-4-22 19:30:07

不是说DeepSeek不行，所有大模型都不能突破AGI。
图灵奖得主杨立昆向GPT宣判死刑：自回归大模型是AI史上最大骗局 - ... - 今日头条虽然我并不完全相信杨立昆的世界模型能走的通，但是我相信他对大模型的判断并非炒作，更不是酸，毕竟他原来就是研究这个的，对自回归大模型的弊端有深刻理解。我的理解也是如此，另外，每次学习都需要大量数据这一大问题在机器人领域表现得尤为严重，动物的行为更多的脑内思维，而非语言思维，不可描述导致大模型几乎无数据可用。

DeepSeek深度求索公司能率先突破AGI吗？

本周热门