【问题标题】:Is it feasible to do the prediction without running the model everytime, just by calling the equation of my train model to predict the test dataset?只需调用我的训练模型的方程来预测测试数据集,就可以在不每次运行模型的情况下进行预测吗?
【发布时间】:2021-03-12 02:50:25
【问题描述】:

我正在运行一个线性方程和随机森林模型,每次我必须运行一个巨大的训练数据集来生成模型并最终使用该模型来预测测试数据集。 是否可以只使用模型的方程而不是运行整个程序,因为它需要大量时间来预测测试数据集?

【问题讨论】:

  • 你到底想用这个方程做什么?
  • 我想预测测试数据集
  • 我不关注这个问题。随机森林模型没有方程

标签: python


【解决方案1】:

当然,您可以只将方程用于线性模型。您只需要访问系数和偏差即可。具体方法取决于您使用的框架。

例如,您可以在sklearn documentation 中看到coeff_ 属性。

保存然后重用随机森林模型要复杂得多。

通用解决方案是:

  1. 训练您的模型。
  2. 使用pickle 将其序列化到文件中。
  3. 当您需要进行预测时,只需使用模型反序列化文件并使用它。

More information about how to serialize a model with pickle or joblib.

另外,不同的框架通常都有内置的模型序列化接口。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2022-10-19
    • 2017-07-16
    • 1970-01-01
    • 2020-07-04
    • 2017-07-01
    • 2012-12-25
    • 2017-05-29
    相关资源
    最近更新 更多