【发布时间】:2020-09-18 03:43:57
【问题描述】:
我已经在本地训练了我的 pycaret 模型,然后我将其推送到 S3。现在我想在更大的生产数据集上运行 predict_model() 方法。
我使用 boto3 将我的模型 pickle 文件从 S3 复制到我的 Spark EMR 集群的主节点。然后我使用
导入库from pycaret.classification import *
并尝试应用我的预测如下 -
model_path = '/tmp/catboost_model_aug19'
saved_model = load_model(model_path)
Transformation Pipeline and Model Successfully Loaded
new_data = spark.sql("select * from table").toPandas()
df = predict_model(saved_model, data = new_data)
当我运行 predict_model() 时,它会报错 Pipeline not found
或者,当我在本地机器上运行相同的代码时,它可以正常工作。如何解决此错误?
【问题讨论】:
-
我也面临与 Pycaret 2.3.1 相同的问题
标签: pycaret