DeepSeek的意义在于使大模型平民化。你搞一台强一点的个人电脑都能自己部署。终结了美国的AI堆叠硬件,垄断芯片建立芯片美元之路。
在绝对智能化方面,DeepSeek并不神,并没有在本质上超越其他模型。只是通过蒸馏技术,节约了硬件成本,少量硬件就能实现原来堆叠大量硬件的效果。
你可以认为,这是一种采用优化的高效的大模型架构。但它本质上还是大模型。
但是这一进步,就不得了,原来搞一个GPT那样能力的模型,要几百亿美元,这谁顶得住,现在只需要几百万美元,而且你不需要面面俱到的话,自己在本地信息系统都能集成,自己一台机器就能部署一套单独的,符合平民化需求。
但是,它是在硬件性能要求上进行优化,你要说它在智能算法上出现质的飞跃就没有,也就是说,DeepSeek能办到的事,gpt只是硬件需求更多,它也能办到。并没有出现DeepSeek能办到但是gpt办不到的事。或者说没有出现不同于gpt这类大模型的AI,或者说并没有找到强人工智能的道路。
所以,你说被神话了还是没被神话了?从模仿到超越的角度,它确实超越gpt了,是一种优秀的同类架构。在国产替代上也是立了大功。但是也滋生了许多蹭概念的上市公司,各种神话炒作股价,其实他压根就是炒作割韭菜的。
所以首先要肯定DeepSeek的技术进步和为国产替代立下的功劳。但是要避免各种擦边蹭概念的神话,过度消耗DeepSeek的品牌价值。 |
|