【发布时间】:2020-03-12 18:21:37
【问题描述】:
我在 MNIST 数据集上训练线性模型,但我只想训练一个数字,即 4。如何选择我的 X_test、X_train、y_test、y_train?
【问题讨论】:
标签: python mnist sklearn-pandas
我在 MNIST 数据集上训练线性模型,但我只想训练一个数字,即 4。如何选择我的 X_test、X_train、y_test、y_train?
【问题讨论】:
标签: python mnist sklearn-pandas
如果你只需要识别4s,这是一个二元分类问题,所以你只需要创建一个新的目标变量:如果class是4,Y=1,如果class不是4,Y=0。
数据会有点不平衡,但应该不是问题!
【讨论】:
您的分类器需要学会区分不同类别的集合。 如果您只关心数字 4,则应将训练集和测试集拆分为:
否则,训练/测试拆分仍然是典型的拆分,您希望没有重叠。
【讨论】: