文心4.0就已经是在大模型领域平均线以上的了,拿清华大学基础模型研究中心发布的《SuperBench 大模型综合能力评测报告》的数据来说明下:文心4.0 在人类对齐能力评测中位居国内首位,在中文推理、中文语言和中文理解上优势明显,在语义理解的数学能力评测中与 Claude-3 并列全球第一,在阅读理解能力评测中超越了 GPT-4 Turbo 等模型,在安全性评测中力压国际一流的 GPT-4 系列模型和 Claude-3 获得最高分。
再把范围拉大点,说全球的话,弗若斯特沙利文发布的《2024 年中国大模型能力评测》里,文心一言也是在数理科学、语言能力、道德责任、行业能力及综合能力等五大评测维度中拿下四项第一的,这表现应该不至于跟ChatGPT差得有多远吧?
所以说,先问是不是,再问为什么。说百度做不出deepseek、llama、chatgpt这样的产品,如果不是准备要炒一波新品,那多少有点人云亦云了。 |
|