【问题标题】:How to train a trained model with new examples in scikit-learn?如何使用 scikit-learn 中的新示例训练训练有素的模型?
【发布时间】:2019-09-09 03:13:32
【问题描述】:

我正在从事一项机器学习分类任务,在该任务中,我用 scikit-learn 中的不同算法训练了许多模型,而随机森林分类器表现最好。现在我想用新的例子进一步训练模型,但是如果我通过在新例子上调用 fit 方法来训练相同的模型,那么它将通过删除旧参数从头开始训练模型。 那么,如何通过在 scikit-learn 中使用新示例来训练训练好的模型呢?

我通过在线阅读对模型进行腌制和解封得到了一些想法,但我不知道它有什么帮助。

【问题讨论】:

标签: python python-3.x machine-learning scikit-learn


【解决方案1】:

您应该使用incremental learning 和实现partial_fit API 的估算器。

【讨论】:

    【解决方案2】:

    RandomForrestClassifier 有一个标志 warm_start。请注意,这不会产生与同时训练两组相同的结果。

    【讨论】:

    • 要在新数据上训练模型,我必须创建另一个模型(RandomForestClassifier 类的对象),然后如果我将其设置为 warm_start=True 那么它如何从另一个模型中获取参数?
    【解决方案3】:

    将新数据附加到您现有的数据集,然后对整个数据集进行训练。可能想要为您的测试集保留一些新数据。

    【讨论】:

    • 这不是我的目标,我为什么要一次又一次地训练我的整个数据集!
    • 因为它是最直接的解决方案。无论添加多少额外的示例,都以相同的方式工作。
    猜你喜欢
    • 2014-10-13
    • 1970-01-01
    • 1970-01-01
    • 2015-10-14
    • 2018-11-26
    • 2022-01-05
    • 2021-04-19
    • 1970-01-01
    • 2018-05-01
    相关资源
    最近更新 更多