【发布时间】:2018-08-11 23:06:33
【问题描述】:
我在sklearn 中建立了一个模型,并以pickle 形式保存。然而,为了获得最好的结果,我不得不删除特征,创建另一个特征,使用 one-hot 编码,等等。
现在,我得到了一个初始形式的新数据点,我需要进行预测。是否有任何简单的方法来转换数据点,以便我构建的模型可以做出预测?
【问题讨论】:
标签: python-2.7 machine-learning scikit-learn
我在sklearn 中建立了一个模型,并以pickle 形式保存。然而,为了获得最好的结果,我不得不删除特征,创建另一个特征,使用 one-hot 编码,等等。
现在,我得到了一个初始形式的新数据点,我需要进行预测。是否有任何简单的方法来转换数据点,以便我构建的模型可以做出预测?
【问题讨论】:
标签: python-2.7 machine-learning scikit-learn
您需要对测试集应用与训练集相同的转换。其中一种方法是编写一个函数来处理数据并使用它。所以你会有这样的东西:
def process_data(x):
# process data, remove features and so on
return processed_data
X_train_processed = process(X_train)
X_test_processed = process(X_test)
【讨论】: