【发布时间】:2018-10-10 11:54:45
【问题描述】:
我保存了一个经过训练的 sci-kit 学习模型作为 joblib 转储(.sav 文件)。训练数据框不可用。我只有测试数据框。
这是解决以下问题的代码:
# Read Dataset
import pandas as pd
data = pd.read_csv("dataset.csv")
# Feature Selection
x_df = df[feature_list]
y_df = df[target_list]
# Split Dataframe for Train and Test
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(x_df, y_df, test_size=0.25, random_state=0)
# SVM Classifier
from sklearn import svm
from sklearn.externals import joblib
model = svm.SVC(kernel='linear',random_state=0)
model.fit(x_train,y_train.values.ravel())
file_name = 'model.sav'
joblib.dump(model, file_name)
现在,我在这里要做的是获取训练数据框中所有类的名称。
是否可以仅从 sav 文件中获取此信息?如果是,如何? 谢谢!
【问题讨论】:
-
请编辑您的答案,说明您使用的型号等。
-
type(joblib.load(filename))的输出是什么? -
答案取决于用于构建该模型的代码。是否有任何预处理步骤(如二值化)应用于标签(类)?
joblib究竟倾倒(保存)了什么?请贴出相应的代码
标签: python machine-learning model scipy scikit-learn