小林他爸 LV
发表于 2025-4-22 10:40:09
在AI算法里 ,数据集划分很重要 ,其中Val和Test常常让人迷糊 。
先说数据集划分 ,简单讲就是把一堆数据分成不同部分 。为啥要划分呢 ?因为要让模型能更好地学习和评估 。
然后说Val ,它叫验证集 。模型在训练过程中 ,除了用训练集来学习知识 ,还需要一个“小考官”来时不时看看自己学得怎么样 ,验证集就充当这个角色 。它能让我们知道模型在没见过的一部分数据上表现如何 ,帮助我们调整模型参数 ,看看模型有没有过拟合或者欠拟合的情况 。
再说说Test ,也就是测试集 。它就像是最终的“大考官” 。等模型在训练集上学得差不多了 ,用验证集调整得也差不多了 ,最后就要用测试集来全面地、正式地评估模型到底好不好 。测试集的数据模型之前完全没见过 ,通过在测试集上的表现 ,我们就能知道模型真正的性能 ,能不能在实际应用中发挥作用 。
总结一下 ,训练集用来让模型学习知识 ,验证集在训练过程中帮着调整模型 ,测试集在最后给模型的能力做最终评判 。 |
|