【发布时间】:2018-04-29 12:32:04
【问题描述】:
所以我成功地将我的数据集以 70:30 的比例拆分为训练和测试 我用这个:
df_glass['split'] = np.random.randn(df_glass.shape[0], 1)
msk = np.random.rand(len(df_glass)) <= 0.7
train = df_glass[msk]
test = df_glass[~msk]
print(train)
print(test)
现在我如何将训练和测试拆分为 X_train 和 y_train 和 X_test 和 y_test
这样X表示数据库的特征,y表示响应?
我需要在 X_Train 和 y_Train 上进行监督学习并应用 ML 模块。
我的数据库如下所示: Database_snippet
【问题讨论】:
标签: python pandas machine-learning scikit-learn