【发布时间】:2017-07-26 03:19:13
【问题描述】:
我有一个巨大的数据集,并且我有一个列,其中有一些我想标记编码的分类数据。在所有预处理之后,我可以训练我的模型并使用 sklearn 序列化模型。
现在我面临一个问题,如果输入预测向量由标签组成,那么我该如何对其进行编码。因为我不希望每次有新的输入预测向量进入时都对模型进行预处理和重新训练。有没有办法在 sklearn 中序列化 labelencoder?解决这个问题的正确方法是什么?
【问题讨论】:
-
你可以只腌制它,就像你对分类器所做的一样(我猜)。
标签: serialization encoding machine-learning scikit-learn