【发布时间】:2018-08-11 06:12:10
【问题描述】:
from sklearn.model_selection import train_test_split
我对 sklearn 的 train_test_split 函数有疑问。首先,我们为什么要拆分数据???我们是否从中获得了测试数据。我们是否只是将数据切成两半并使用其中一些来训练和一些来测试?比没有意义,因为数据已经被填充。如果它被填满了,那么我们现在在预测什么?我需要帮助!
【问题讨论】:
-
谷歌“过拟合”
-
我不明白?
-
查找“过度拟合”,这将回答您的问题。
-
那么,测试数据是否已经填满了列?
-
如果是,那我们为什么要使用测试数据呢?答案已经存在
标签: python machine-learning scikit-learn train-test-split