问:如题。
找到的相关解答:应该数据集划分后,不然测试集里面实际上是包含了训练集的信息的,这会影响模型的测试效果。但其实当样本量足够大的时候,随机划分的训练集和测试集其实是有相同的分布的,所以理论上是可以忽略上面说到的东西的。
本文讨论了数据集划分的重要性,特别是训练集和测试集的随机划分。当样本量足够大时,训练集与测试集能保持相同的数据分布,此时即使测试集中包含部分训练集信息,其对模型测试效果的影响也可忽略。
问:如题。
找到的相关解答:应该数据集划分后,不然测试集里面实际上是包含了训练集的信息的,这会影响模型的测试效果。但其实当样本量足够大的时候,随机划分的训练集和测试集其实是有相同的分布的,所以理论上是可以忽略上面说到的东西的。
1874
8221
1802

被折叠的 条评论
为什么被折叠?
