Update: 实测专门为了刷分喂足了LMSYS inference costs,在其他地方包括Apps上跑的结果差太远了,这是内部忽悠老马不懂技术啊
不过可能老马本身也喜欢这样赢
=================================
Update: 输了,那么高的分数,心服口服,所以真的不需要其他太多的技巧么?力大砖飞仍然碾压?
=================================
发布前无脑预测一下,Elon Musk重新定义"最聪明",照以前那种Grok的低效表现看,很可能不会太惊艳,尤其是pre training的墙就在那里, Ilya不会错, OpenAI也试过,所以倒推回来一个容易的推论是,Elon在说的是广告词。
最重要的一点是现在来看xAI的eng lead并没有特别突出的才能,Elon对软件领域也不太懂,上一次他做软件相关是paypal,之后再做twitter,做auto driving,到现在AI,大家都卷的领域,他并不特别。
Elon之前的成功价值在于,能够强硬推进用Software Engineering的方法论在其他进展缓慢的传统领域形成代差的改进
利益相关,已在Polymarket上下注了best AI model is not xAI |
|