如何使用 scikit-learn 中的新示例训练训练有素的模型？

【问题标题】：How to train a trained model with new examples in scikit-learn?如何使用 scikit-learn 中的新示例训练训练有素的模型？
【发布时间】：2019-09-09 03:13:32
【问题描述】：

我正在从事一项机器学习分类任务，在该任务中，我用 scikit-learn 中的不同算法训练了许多模型，而随机森林分类器表现最好。现在我想用新的例子进一步训练模型，但是如果我通过在新例子上调用 fit 方法来训练相同的模型，那么它将通过删除旧参数从头开始训练模型。那么，如何通过在 scikit-learn 中使用新示例来训练训练好的模型呢？

我通过在线阅读对模型进行腌制和解封得到了一些想法，但我不知道它有什么帮助。

【问题讨论】：

也许这里提出的一些建议会有所帮助datascience.stackexchange.com/questions/28512/…
我在这里问我的问题之前检查了该页面，并且该问题的答案没有帮助。

标签： python python-3.x machine-learning scikit-learn

【解决方案1】：

您应该使用incremental learning 和实现partial_fit API 的估算器。

【讨论】：

【解决方案2】：

RandomForrestClassifier 有一个标志 warm_start。请注意，这不会产生与同时训练两组相同的结果。

【讨论】：

要在新数据上训练模型，我必须创建另一个模型（RandomForestClassifier 类的对象），然后如果我将其设置为 warm_start=True 那么它如何从另一个模型中获取参数？

【解决方案3】：

将新数据附加到您现有的数据集，然后对整个数据集进行训练。可能想要为您的测试集保留一些新数据。

【讨论】：

这不是我的目标，我为什么要一次又一次地训练我的整个数据集！
因为它是最直接的解决方案。无论添加多少额外的示例，都以相同的方式工作。

猜你喜欢

2014-10-13
1970-01-01
1970-01-01
2015-10-14
2018-11-26
2022-01-05
2021-04-19
1970-01-01
2018-05-01

相关资源

下载 2021-06-06
下载 2023-02-17
下载 2021-06-06

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode