以“查一条新闻”为起点,我们对六款国产AI进行了测试,评估AI引用新闻事实的可靠程度。
我们拿着30条新闻片段,一共向AI提问了330次。这是330次问讯后的几个核心发现:
AI很难准确引用新闻报道,六款AI的平均准确率只有25%,其中豆包最准确、文心一言出错最多、通义千问最常拒绝回答。
大部分AI依然会自信提供错误答案,而不是承认不知道。
来源是错误重灾区,27%的新闻来源被AI完全说错。
AI经常表示自己找不到链接,或者提供已被删除的链接,因此很难验证出处——而且一些打不开的链接地址明显是编造的。
AI普遍链接到新浪财经、腾讯新闻等门户网站,不乏给自媒体“搬运号”引流,而不是原始来源。媒体拿流量更难了。
详见:
|
|