为什么BAT没做出DeepSeek？

如题，我怎么感觉国内互联网又要洗牌了，上一轮的大厂创新能力严重不足

发表于 2025-4-7 11:42:16

可以踩一下百度
但是阿里和腾讯真没必要
qwen2.5依然是我目前认为潜力第一的大模型，潜力第一
腾讯混元在多模态方面也很强

发表于 2025-4-7 11:52:25

Qwen就是阿里达摩院的啊，曾经世界最好的开源大模型，推理模型慢了一步而已。但谷歌、Meta、Claude也没快哪去啊……
至于百度，百度现在的规模就决定了必然虎头蛇尾浅尝辄止。
腾讯的混元应该是国内多模态做得最好的，主打一个财大气粗。单论LLM可能确实算不上一线，混元Turbo也不过对标ChatGpt4o，但是文生图、文生视频、3D生成基本完成了整合，而且还都不错。
其他像字节的豆包，母公司财大气粗，卡多人多；月之暗面营销做的不错，Kimi是商业化做的最好的国产大模型了，而且和Claude一样偏重特定赛道，成功打出一片天地。
可以说，Llama开源后上车的这批选手，本来就处于混战状态。DPSK逼近OpenAI不是开始，也不是结束，这只是开始的结束。
至于谷歌开源Transformer后早早上车的百度为什么搞成了现在这样子，只能尊重祝福理解三连击了……

发表于 2025-4-7 12:00:53

额，qwen 一直是中文圈里最强的大模型。在这次 R1 之前一直是稳压 deepseek。就算现在有了 R1，跟最新的 qwen也是不相上下，没有档次差距。
去年接触的海外很多 sft 的模型，底座用的都是 qwen。说qwen 一直是华语开源 llm模型之光也不为过。
我很烦知乎上很多人平时根本不关心国内 ai 产业的发展。看到出了一个好的，一边过度吹捧，一边捧一踩一。
现在 deepseek 变成了一些人的尚方宝剑。一会踩一下美国，一会踩一下国内互联网大厂。
很没意思。
ai 行业内部大家交流很多，实际上各个团队之间人员流动都很密集。有没有想过，一些 deepseek 的开发者之前是 qwen 团队的，而qwen 团队也有 deepseek 的开发？
创新本身就有偶然性，下次突破谁知道又会发生在哪个团队里呢？

发表于 2025-4-7 12:13:00

然而第一次在huggingface屠榜的中国大模型就是阿里的qwen啊... ..
腾讯混元在开源视频大模型领域是独一档。

发表于 2025-4-7 12:25:24

阿里在这件事里绝对是最冤的那个。
当时Qwen2.5霸榜了openllm好久，夸张到Best XXX Model从0.5B的到70B的清一色全都是Qwen2.5。
现在随便翻进一个rank（openllm，只有开源模型）：

看起来百花齐放是吧？然而事实上是点进去看看前十名都TM是Qwen2.5 72B上finetune的。
你再随便翻进另一个rank（arena hard）

这个有点老了，第一个开源模型也是Qwen72b finetune出来的。
你再随便翻进一个rank（live bench），这个很新，上面甚至有R1/V3。R1/V3之后的开源模型就是Qwen72b给finetune出来的。
之后阿里的创新能力就严重不足了，悲。事实上Deepseek发了一个R1一个V3，之后又有好几个版本finetune的qwen，为什么他发布的是

distill的qwen不是其他模型（像llama）？肯定是有}理由的啊。

为什么BAT没做出DeepSeek？

本周热门